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z 庆 于 肌 


随 大 我 国 改 革 开 放 的 进一步 深化 ， 高 等 教育 也 得 到 了 快速 发 展 各 地 高 校 紧密 结合 
方 经 济 建设 发 展 需要 , 科学 运用 市 场 调节 机 制 , 加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 、 
改造 传统 学 科 专 业 的 投入 力度 ， 通 过 教育 改革 合理 调整 和 配置 了 教育 资源 ， 优 化 了 传统 学 
科 专 业 ， 积 极为 地 方 经 济 建设 输送 人 才 ， 为 我 国 经 济 社会 的 快速 、 健 康 和 可 持续 发 展 以 及 
高 等 教育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ， 高 等 教育 质量 还 需要 进一步 提高 以 适应 
经 济 社会 发 展 的 需要 , 不 少 高 校 的 专业 设置 和 结构 不 尽 合 理 , 教师 队伍 整体 素质 吸 待 提高 ， 
人 才 培 养 模式 、 教 学 内 容 和 方法 需要 进一步 转变 ， 学 生 的 实践 能 力 和 创新 精神 吸 待 加强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ， 教 育 部 下 发 了 《关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 》 计划 实施 “高 等 学 校本 科教 学 质量 与 教学 改革 
工程 (简称 “质量 工程 ')”， 通过 专业 结构 调整 、 课 程 教材 建设 、 实 践 教学 改革 、 教 学 团队 
建设 等 多 项 内 容 ， 进 一 步 深 化 高 等 学 校 教学 改革 ， 提 高 人 才 培 养 的 能 力 和 水 平 ， 更 好 地 满 
足 经 济 社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 沙 实 教育 部 “质量 工程 ”的 过 程 中 ， 各 地 
高 校 发 挥 师资 力量 强 、 办 学 经 验 丰 富 、 教 学 资源 充裕 等 优势 , 对 其 特色 专业 及 特色 课程 (和 群 ) 
加 以 规划 、 整 理 和 总 结 ， 更 新 教学 内 容 、 改 革 课 程 体 系 ， 建 设 了 一 大 批 内 容 新 、 体 系 新 、 
方法 新 、 手 段 新 的 特色 课程 。 在 此 基础 上 ， 经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建 
议 ， 清 华 大 学 出 版 社 在 多 个 领域 精 选 各 高 校 的 特色 课程 ， 分 别 规划 出 版 系列 教材 ， 以 配合 
“质量 工程 ”的 实施 ， 满 足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 《关于 加 强 高 等 学 校本 科教 学 工作 ， 提 高 教学 质量 的 若干 意 
见 》 精 神 ， 紧 密 配合 教育 部 已 经 启动 的 “高 等 学 校 教 学 质量 与 教学 改革 工程 精品 课程 建设 
工作 ”在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支 持 下 ,我们 组 织 并 成 立 了 “清华 大 学 
出 版 社 教材 编审 委员 会 ”( 以 下 简称 “ 编 委 会 ”), 上 旨 在 配合 教育 部 制定 精品 课程 教材 的 出 版 
规划 ,讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 ”成 员 皆 来 自 全 国 各 类 高 等 学 
校 教 学 与 科研 第 一 线 的 骨干 教师 ， 其 中 许多 教师 为 各 校 相关 院 、 系 主管 教学 的 院 长 或 系 
主任 。 

按照 教育 部 的 要 求 ,“ 编 委 会 ”一 致 认为 ， 精 品 课程 的 建设 工作 从 开始 就 要 坚持 高 标 
准 、 严 要 求 ， 处 于 一 个 比较 高 的 起 点 上 ; 精品 课程 教材 应 该 能 够 反映 各 高 校 教学 改革 与 课 
程 建设 的 需要 ， 要 有 特色 风格 、 有 创新 性 (新 体系 、 新 内 容 、 新 手段 、 新 思路 ， 教 材 的 内 
容 体 系 有 较 高 的 科学 创新 、 技 术 创 新 和 理念 创新 的 含量 )、 先 进 性 (对 原 有 的 学 科 体 系 有 实 
质 性 的 改革 和 发 展 , 顺应 并 符合 21 世纪 教学 发 展 的 规律 , 代表 并 引领 课程 发 展 的 趋势 和 方 
问 )、 示 范 性 (教材 所 体现 的 课程 体系 具有 较 广 泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 瞻 性 。 教 
材 由 个 人 申报 或 各 校 推荐 (通过 所 在 高 校 的 “ 编 委 会 ”成 员 推 荐 ), 经 “ 编 委 会 ”认真 评审 ， 
最 后 由 清华 大 学 出 版 社 审定 出 版 。 


4 数据 结构 教程 与 题解 


目前 ， 针 对 计算 机 关 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 >， 即 “ 清 华 大 学 出 
版 社 计 算 机 教材 编审 委员 会 ”和 “清华 大 学 出 版 社 电 子 信息 教材 编审 委员 会 。 推出 的 特色 


精品 教材 包括 : 

(1) 21 世纪 高 等 学 校规 划 教材 。 计 算 机 应 用 一 一 融 等 学 校 各 类 专业 ， 特 别 是 非 计 算 机 
专业 的 计算 机 应 用 类 教材 。 

(2) 21 世纪 高 等 学 校规 划 教 材 。 计算机 科学 与 技术 一 一 局 等 学 校 计算 机 相关 专业 的 
教材 。 


(3) 21 世纪 高 等 学 校规 划 教 材 。 电 子 信息 一 高 等 学 校 电 子 信息 相关 专业 的 教材 。 
(4) 21 世纪 高 等 学 校规 划 教 材 。 软 件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 
(5) 21 世纪 高 等 学 校规 划 教 材 。 信 息 管 理 与 信息 系统 。 

(6) 21 世纪 高 等 学 校规 划 教 材 。 财 经 管理 与 应 用 。 

(7) 21 世纪 高 等 学 校规 划 教 材 。 电 子 商 务 。 

(8) 21 世纪 高 等 学 校规 划 教 材 。 物 联网 。 


清华 大 学 出 版 社 经 过 二 十 多 年 的 努力 ， 在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 出 
版 方面 树立 了 权威 品牌 ， 为 我 国 的 高 等 教育 事业 做 出 了 重要 页 献 。 清 华 版 教材 形成 了 技术 
准确 、 内 容 严 并 的 独特 风格 ， 这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 
E-mail:weiljj@tup.tsinghua.edu.cn 


随 看 计算 机 软 、 人 硬件 技术 的 迅速 发 展 ， 计 算 机 的 应 用 越 来 越 普及 和 广泛 。 但 不 管 计 算 
机 作 何 用 途 , 每 一 项 应 用 总 是 某 个 程序 的 运行 , 用 计算 机 解决 任何 问题 都 离 不 开 程序 设计 。 
程序 设计 的 实质 就 是 数据 的 表示 和 数据 的 处 理 ， 数 据 结 构 就 是 研究 这 两 个 方面 的 一 些 基 本 
问题 的 ， 包 括 如 何 有 效 地 组 织 数 据 、 数 据 元 素 之 间 是 什么 关系 、 数 据 在 计算 机 中 如 何 表示 
以 及 如 何 对 数据 进行 有 效 的 操作 等 。 

“数据 结构 ”是 计算 机 和 信息 类 专业 的 一 门 专业 基础 课程 ， 特 别 对 计算 机 软件 和 应 用 
专业 还 是 一 门 核心 课程 。 在 众多 的 计算 机 系统 软件 和 应 用 软件 中 , 都 要 用 到 各 种 数据 结构 。 
仅 靠 掌握 几 种 计算 机 程序 语言 是 难以 应 付 众 多 复杂 问题 的 ， 要 想 有 效 地 使 用 计算 机 解决 实 
际 问题 ， 必 须 积 极 主动 地 学 习 和 应 用 数据 结构 的 有 关 知 识 。 数 据 结构 对 设计 高 性 能 的 程序 
和 软件 至 关 重 要 。 

数据 结构 的 内 容 非常 丰富 ， 除 了 基本 知识 外 ， 贯 穿 全 课程 的 链表 结构 和 递归 技术 ， 以 
及 隐 仿 在 各 算法 中 的 技术 和 方法 等 都 是 学 习 中 的 重点 和 难点 。 多 年 的 教学 经 验 表明 ， 选 择 
一 本 合适 的 数据 结构 教材 对 这 门 课程 的 教学 至 关 重 要 ， 过 分 抽象 、 过 分 简单 ， 或 者 过 分 复 
杂 ， 都 不 利于 学 生 的 学 习 ， 也 不 利于 教师 的 讲授 。 鉴 于 此 ， 本 书 的 编写 力求 通俗 易 懂 ， 概 
念 明确 , 并 对 有 些 内 容 进 行 了 取 侈 。 本 书 的 课 后 习题 不 仅仅 是 为 了 复习 和 巩固 各 章 的 知识 ， 
还 常常 安排 成 有 关内 容 的 补充 、 细 化 和 深化 ， 以 适应 有 兴趣 深入 学 习 的 读者 ; 附录 的 参考 
答案 中 一 般 给 出 了 较 完 整 的 解答 。 

在 本 书 的 编写 中 参考 了 众多 相关 教材 和 辅导 材料 ， 参 考 文 献 中 未 能 一 一 列 出 ， 在 此 诚 
挚 地 对 这 些 作 者 和 编者 表示 衷心 的 感谢 。 

本 书 是 在 2003 年 出 版 的 《数据 结构 教程 与 题解 (用 C/C++ 描述 )》 基 础 上 ， 经 过 几 年 
的 不 断 修 订 而 成 ， 除 了 更 新 和 改写 了 大 量 内 容 外 ， 也 补充 了 一 些 内 容 ， 如 KMP 算法 、 广 
义 表 的 储存 结构 、 外 排序 简介 ， 以 及 通过 脚注 、 附 录 的 形式 指出 了 文献 中 一 些 含义 有 别 的 
名 称 ， 一 些 结 论 、 公 式 、 定 理 等 的 推导 等 ， 使 全 书 更 加 完整 。 另 外 ， 在 附录 中 还 给 出 了 几 
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概论 


随 独 计算 机 的 普及 和 软 硬 件 技术 的 发 展 ， 计 算 机 的 应 用 越 来 越 广泛 ， 但 不 管 计算 机 作 
何 用 途 ， 每 一 项 应 用 总 是 茶 个 程序 的 运行 。 所 以 ， 用 计算 机 解决 任何 问题 部 离 不 开 程序 设 
计 ， 而 程序 设计 的 实质 就 是 数据 的 表示 和 数据 的 处 理 ， 数 据 结构 就 是 研究 这 两 个 方面 的 一 
些 基 本 问题 的 ， 包 括 如 何 组 织 数 据 、 数 据 元 素 之 间 是 什么 关系 、 数 据 在 计算 机 中 如 何 表 示 
以 及 如 何 对 数据 进行 操作 等 。 数 据 结构 对 设计 高 性 能 程序 和 软件 全 天 重 要 。 

本 章 介 绍 了 数据 结构 的 基本 概念 ， 包 括 数据 的 逻辑 结构 、 存 储 结 构 、 基 本 运算 和 运算 
的 实现 以 及 算法 分 析 等 。 
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在 现实 生活 中 ， 当 我 们 谈 到 事物 的 “结构 ”时 ， 一 般 是 指 它 由 哪些 部 分 组 成 ， 各 部 分 
之 间 的 相互 关系 如 何等 ， 如 对 于 计算 机 读 程 的 体系 结构 ， 我 们 会 天 心 它 有 哪些 诛 程 、 各 诛 
程 之 间 的 关系 如 何等 。 所 以 ， 对 “数据 结构 ”这 个 概念 ， 从 字面 上 可 以 理解 为 数据 的 组 成 
和 相互 间 的 关系 ， 或 称 数 据 的 组 织 形 式 。 不 过 这 并 不 全 面 ， 因 为 数据 结构 中 还 应 包含 数据 
的 相关 操作 。 本 章 后 面 会 逐步 对 数据 结构 进行 解释 ， 其 中 会 涉及 很 多 相关 概念 。 这 里 先 看 
男 一 个 问题 ,我们 为 什么 要 学 习 数 据 结 构 ? 或 者 说 学 习 数 据 结构 有 什么 用 ? 

人 简单 地 说 ， 学 习 数 据 结构 是 我 们 编程 的 需要 。 这 是 因为 ， 不 论 什 么 程序 ， 它 本 质 上 都 
是 计算 机 对 茶 种 数据 的 加 工 处 理 , 计算 机 相当 于 一 个 处 理 机 , 数据 是 它 加 工 处 理 的 “原料 ”。 
这 里 涉及 两 个 基本 问题 : 首先 ， 数 据 要 存储 到 计算 机 中 ， 才 能 被 计算 机 加 工 处 理 ， 其 次 ， 
如 何 对 数据 进行 处 理 。 前 一 个 问题 称 为 数据 表示 ， 后 一 个 问题 称 为 数据 处 理 。 所 以 ， 程 序 
设计 的 实质 就 是 数据 的 表示 和 数据 的 处 理 。 

数据 在 计算 机 存储 右 内 的 存在 形式 称 为 机 内 表示 ， 这 之 前 的 数据 表现 形式 称 为 机 外 表 
未 ， 所 以 数据 表示 的 工作 束 是 将 数据 从 机 外 表示 转化 为 机 内 表示 。 在 数据 表示 中 ， 不 是 简 
单 地 将 数据 的 值 存储 到 计算 机 中 就 可 以 了 ， 还 要 直接 或 间接 地 存储 数据 之 间 的 相互 关系 ， 
对 关系 的 表示 第 剃 是 一 些 复杂 问题 的 关键 。 数 据 处 理 的 工作 束 是 用 计算 机 可 执行 语句 编制 
程序 ， 描 述 对 已 存 入 计算 机 的 数据 进行 各 种 具体 操作 ， 继 而 完成 整个 处 理 任 务 。 数 据 结构 
误 是 研究 程序 设计 过 程 中 数据 表示 和 数据 处 理 这 两 个 方面 的 一 些 基 本 问题 的 。 

或 许 有 人 会 问 : 我 们 以 前 学 习 高 级 语言 如 C/C++ 语 言 时 ， 并 没有 学 过 数据 结构 ， 不 是 
一 样 也 编 出 了 很 多 程序 并 且 运 行 得 很 好 吗 ? 这 里 有 一 个 认识 问题 。 首 先 ， 我 们 在 学 习 局 级 
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语言 时 所 编制 的 程序 基本 上 是 属于 数值 计算 型 的 ， 如 级 数 求 和 、 方 程 求 根 等 ， 所 涉及 的 运 
算 对 象 比较 简单 ， 如 整数 、 和 实数 等 ， 数 据 结构 的 问题 不 明显 ; 其 次 ， 即 便 如 此 ， 我 们 在 编 
程 中 也 不 知 不 觉 地 、 或 多 或 少 地 使 用 了 数据 结构 的 一 些 知识 或 方法 。 最 后 ， 从 数据 结构 的 
观点 看 ， 即 使 是 一 个 单独 的 数据 ， 如 一 个 整数 或 字符 ， 也 可 看 成 一 个 简单 的 数据 结构 。 

下 面 先 看 一 个 简单 的 例子 。 

例 1.1 方程 求 根 : 

f(x)=asx*+alx+ao=0 

解 : 首先 要 把 方程 的 系数 存 入 计算 机 ， 如 用 3 个 变量 a。、a1、as 表示， 然后 才能 进行 
具体 的 求 根 计 算 。 这 就 是 我 们 在 学 习 融 级 语言 时 一 般 采 用 的 方法 。 但 对 一 般 形式 的 方程 : 

fx)=anx?n+a 1X™ +***+alxX+ao=0 

我 们 一 般 束 不 会 对 每 个 系数 都 用 单独 的 变量 名 来 表示 了 ， 因 为 变量 多 ， 对 名 字 的 管理 
和 书写 都 很 不 方便 ， 如 20 次 的 多 项 式 ， 就 需要 21 个 变量 名 。 这 时 ， 我 们 一 般 会 用 一 个 数 
组 如 A[21] 来 集中 存放 这 些 系 数 ， 这 样 只 需 记 住 一 个 名 字 ， 即 数组 名 ， 然 后 通过 数组 下 标 来 
区 分 各 个 系数 ， 如 A 表示 ai。 这 里 ， 数 组 就 是 数据 结构 中 一 种 比较 简单 的 存储 结构 
顺序 存储 结构 ， 它 将 各 个 元 素 在 存储 空间 上 连续 存放 。 

如 果 多 项 式 的 次 数 不 定 ， 上 述 方法 又 有 问题 ， 如 C/C++ 等 语言 中 数组 的 大 小 一 经 定义 
后 就 不 能 凡 变 化 ， 这 时 ， 如 果 数 组 定义 得 较 大 ， 而 多 项 式 的 次 数 低 ， 实 际 系 数 少 ， 数 组 空 
间 就 有 浪费 现象 ， 反 之， 如 果 数 组 定义 得 较 小 ， 而 多 项 式 的 次 数 蜗 ， 实 际 系数 多 ， 数 组 宇 
间 就 可 能 不 足 而 产生 洲 出 。 为 适应 数据 个 数 变 化 的 情况 ， 我 们 可 用 内 存 分 配 函 数 为 每 个 系 
数 动态 分 配 空间 ， 并 通过 指针 将 它们 联系 起 来 ， 即 得 到 链表 。 这 里 ， 链 表 也 是 数据 结构 中 
党 用 的 一 种 存储 结构 一 一 链 式 存储 结构 。 

如 果 上 由 考虑 到 多 项 式 的 系数 中 通常 有 很 多 为 零 ， 为 了 节省 存储 空间 ， 并 和 书写 习惯 一 
人 至， 我 们 可 不 存储 者 系数 ， 但 这 时 要 把 非 零 系数 和 原 多 项 式 之 间 的 关系 表示 清楚 ， 束 涉及 
数据 的 压缩 存储 问题 ， 也 是 数据 结构 里 要 研究 的 内 容 。 

在 上 面 存放 各 系数 时 ， 不 论 数 组 还 是 链表 ， 我 们 显然 不 会 胡乱 存储 ， 而 是 很 目 然 地 按 
照 系 数 间 的 “前 后 ”次 序 ， 即 按 对 应 项 的 次 数 从 融 到 低 或 从 低 到 融 来 进行 。 这 实际 上 说 明 
了 这 样 一 个 问题 ， 这 些 系 数 间 是 有 相互 关系 的 ， 对 本 问题 ， 它 们 按 次 数 的 高 低 顺 序 形成 一 
个 有 穷 序 列 (ao, al, aa，…, an)， 对 任 一 个 系数 a:， 排 在 它 前 面 的 与 之 相 邻 的 系数 以 及 排 在 它 
后 面 的 与 之 相 邻 的 系数 都 最 多 只 有 一 个 ， 这 是 数据 结构 里 一 种 比较 便 单 的 多 辑 结 构 一 一 线 
性 结构 。 

将 系数 存储 到 计算 机 中 后 ， 束 可 以 进行 求 根 计算 7 了。 对 低 次 方程 如 2 次 、3 次 ， 可 用 
求 根 公 式 ， 但 一 般 情 况 下 要 采用 迭代 法 ， 如 牛顿 欠 代 法 。 在 计算 中 ， 要 涉及 x 的 各 次 方 x， 
显然 不 必 每 个 都 单独 计算 ,否则 会 有 很 多 重复 计算 ， 如 x 不 必用 x*xxx 来 计算 ， 可 以 在 已 
有 x 的 基础 上 再 做 一 次 乘法 xxx 即 可 。 这 里 ， 怎 样 实现 具体 的 计算 方法 ， 属 于 算法 问题 ， 
而 怎样 评价 算法 的 效率 ， 就 是 算法 分 析 问 题 。 这 都 是 数据 结构 里 要 讨论 的 内 容 。 

可 见 ， 对 这 个 例题 ， 我 们 已 经 “无 意 间 ”用 到 了 数据 结构 的 一 些 相 关 知识 ， 同 时 也 看 
到 ， 即 使 问题 不 太 复杂 ， 如 果 只 有 程序 语言 方面 的 知识 ， 将 数据 如 何 有 效 地 组 织 起 来 ， 以 
及 如 何 对 数据 进行 有 效 的 运算 已 显得 有 些 “ 力 不 从 心 ” 了 。 

上 述 例 子 属于 数值 计算 问题 ， 在 计算 机 发 展 初期 ， 人 们 使 用 计算 机 主要 就 是 处 理 这 类 
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问题 的 。 由 于 所 涉及 的 数据 对 象 比 较 简单 ， 如 整 型 、 实 型 或 布尔 型 等 ， 数 据 结构 的 问题 不 
突出 ， 程 序 设计 者 的 主要 精力 集中 在 程序 设计 的 搁 巧 上 ， 解 决 此 类 问题 的 关键 是 数 值 计 算 
方法 算法)， 程 序 以 算法 为 中 心 。 

但 是 ， 大 量 的 实际 问题 仅 赁 高 级 语言 的 知识 是 无 法 处 理 的 ， 必 须 主动 地 借助 于 数据 结 
构 的 知识 。 这 是 因为 ， 随 看 计算 机 软 硬 件 的 发 展 和 计算 机 的 普及 ， 计 算 机 应 用 领域 不 断 扩 
大 ， 早 已 不 再 局 限于 科学 计算 了 ， 大 量 的 应 用 ， 如 文学 处 理 、 数 据 库 、 多 媒体 、 游 戏 、 过 
程控 制 等 都 是 非 数 值 型 问题 。 在 这 些 问题 中 ， 要 处 理 的 数据 一 般 比 较 复 杂 ， 如 字符 、 表 格 、 
图 像 、 声 音 等 ， 这 不 仅 体现 在 数据 的 内 容 比较 复杂 ,更 主要 的 是 数据 之 间 还 有 复杂 的 关系 ， 
而 这 些 关 系 无 法 用 数学 方程 式 描述 ， 另 外， 对 数据 的 处 理 一 般 也 很 复杂 。 于 是 ， 如 何 有 效 
地 组 织 数据 以 及 如 何 对 数据 进行 有 效 的 运算 等 问题 束 成 了 处 理 这 类 问题 的 关键 ， 而 这 正 是 


数据 结构 所 要 研究 的 。 
例 1.2 用 计算 机 进行 部 门 机 构 〈( 如 图 1.1 所 示 ) 管理 。 
总 经 理 
设计 部 


《华南 区 ) 《华中 区 ) 。 : 《机 芯 组 ) (外 这 组 ) 


1.1 机 构 组 成 示意 图 


解 : 这 里 要 处 理 的 数据 是 整个 机 构 ， 它 由 各 个 部 门 组 成 。 显 然 要 将 各 个 部 门 的 信息 存 
储 到 计算 机 中 ， 如 员工 数 、 位 置 、 编 写 、 名 称 等 ， 我 们 可 用 结构 或 称 记录 ) 类 型 的 量 来 
表示 这 些 信息 。 然 而 ， 理 顺 部 门 之 间 的 关系 ， 或 者 说 对 关系 的 表示 才 是 问题 的 关键 : 各 部 
门 间 可 能 是 上 下 级 关系 ， 也 可 能 是 同 级 关系 ， 整 个 部 门 机 构 组 成 一 种 层次 结构 。 如 果 不 把 
这 些 关 系 表 示 出 来 ， 这 个 问题 根本 束 没 法 解决 。 层 次 关系 可 很 目 然 地 用 图 1.1 的 形式 表示 ， 
其 中 ， 每 个 部 门 用 一 个 椭圆 框 表示 ， 椭 圆 框 间 的 连 线 表示 上 下 级 关系 : 每 个 部 门 最 多 只 有 
一 个 直接 上 级 ， 但 可 有 多 个 直接 下 级 。 数 据 的 这 种 层次 结构 在 数据 结构 里 称 为 树 。 

所 以 ， 在 存储 部 门 数据 时 ， 还 要 将 部 门 则 的 关系 存储 起 来 或 反映 出 来 。 我 们 可 以 将 所 
有 部 门 按 茶 种 次 序 依次 存放 到 一 片 连续 的 内 存单 元 中 ， 并 在 每 个 部 门 中 增加 上 下 级 关系 信 
县 ， 比 如 增加 上 级 关系 信息 ， 这 可 用 一 个 指针 来 表示 ， 即 指出 它 上 级 部 门 的 存储 位 置 。 这 
样 ， 从 任 一 个 部 门 通 过 指 癌 上 级 的 指针 可 找到 它 的 所 有 上 级 ;如 果 茶 个 部 门 的 上 级 指针 为 
空 ， 则 和 它 是 最 上 级 的 部 门 ， 如 条 要 考 穴 共 两 个 部 门 之 间 有 没有 上 下 级 关系 ， 则 只 要 看 其 中 
菏 个 部 门 的 上 级 中 有 没有 为 一 个 就 可 以 了 。 这 是 树 形 结构 的 一 种 双亲 存储 结构 。 

将 部 门 数据 存 储 到 计算 机 中 以 后 ， 束 可 对 其 进行 有 天 的 管理 工作 了 ， 如 新 部 门 的 增加 
(插入 )、 旧 部 门 的 撤销 《删除 )、 部 门 的 查询 等 ， 这 些 操作 的 具体 实现 过 程 就 是 本 问题 的 
算法 。 

上 面 两 个 例子 用 到 的 数据 结构 是 线性 表 和 树 。 一 般 说 来 ， 为 了 有 效 地 表示 数据 ， 特 别 
是 数据 之 间 的 关系 ， 需 要 设计 和 采用 合适 的 数据 结构 (以 将 数据 组 织 起 来 ， 不 妨 称 此 工作 


NA 数据 结构 教程 与 题解 


为 数据 的 “结构 化 ”)， 在 此 基础 上 才能 写 出 有 效 的 算法 完成 数据 的 处 理 ， 从 而 有 效 地 解决 
实际 问题 。 在 实践 中 经 第 会 遇 到 这 种 现象 : 同一 个 问题 ， 采 用 一 个 “好 ”的 数据 结构 很 快 
就 能 完成 运算 ， 而 采用 一 个 “ 兰 ” 的 数据 结构 ， 运 算 时 间 可 能 会 相差 几 倍 甚 全 几 十 倍 或 更 
多 《比如 本 书后 面 将 介绍 的 查找 表 ， 对 不 同 的 数据 组 织 结构 ， 相 应 得 找 算法 的 效率 束 会 有 
巨大 的 产 弄 )。 

车 名 的 瑞士 计算 机 科学 家 沃 轧 (N.Wirth) 教授 曾 提 出 : 算法 + 数据 结构 = 程序 。 这 里 的 
数据 结构 是 指数 据 的 好 辑 结 构 和 存储 结构 ， 而 算法 则 是 对 数据 运算 的 拍 述 。 由 此 可 见 ， 程 
序 设计 的 实质 也 可 看 成 是 对 实际 问题 选择 一 种 好 的 数据 结构 ， 加 之 设计 一 个 好 的 算法 ， 而 
好 的 算法 在 很 大 程度 上 取决 于 描述 实际 问题 的 数据 结构 。 

在 众多 的 计算 机 系统 软件 和 应 用 软件 中 ， 都 要 用 到 各 种 数据 结构 。 仅 和 菲 擎 握 几 种 计算 
机 语言 是 难以 应 付 众多 复杂 问题 的 ， 要 想 有 效 地 使 用 计算 机 解决 实际 问题 ， 必 须 积极 主动 
地 学 习 和 应 用 数据 结构 的 有 关 知 识 。 

数据 结构 作为 一 门 独立 课程 ， 是 在 1968 年 开始 设立 的 ， 美 国 唐 - 欧 : 克 努 特 教 授 开 创 了 
其 最 初 体系 。 现 在 它 是 一 门 研究 数据 组 织 、 存 储 和 运算 的 一 般 方 法 的 学 科 ， 介 于 数学 、 计 
算 机 硬件 和 计算 机 软件 三 者 之 间 ， 是 计算 机 软件 和 计算 机 应 用 专业 的 一 门 核心 读 程 ， 也 是 
一 些 计算 机 软件 相关 专业 的 重要 读 程 。 它 不 仅 是 一 般 程序 设计 的 基础 ， 也 是 设计 和 实现 编 
译 程序 、 操 作 系 统 、 数 据 库 系统 及 其 他 系统 程序 和 大 型 应 用 程序 的 重要 基础 。 


42 数据 结构 的 概念 


上 市 已 涉及 了 数据 结构 的 一 些 概 仿 ， 但 没有 具体 解释 ， 下 和 面 对 数 据 结构 的 一 些 概念 和 
术语 进行 比较 详细 的 介绍 。 


1.2.1 数据 
从 数据 结构 的 观点 看 ， 通 常 所 说 的 “数据 ”应 分 成 三 个 不 同 的 层次 ， 即 数据 、 数 据 元 
素 和 数据 项 。 


数据 (Data): 凡 能 被 计算 机 存储 、 加 工 处 理 的 对 象 通称 为 数据 。 它 是 计算 机 程序 加 工 
处 理 的 对 象 和 原料 。 前 已 指出 ， 早 期 的 计算 机 主要 用 于 科学 计算 ， 数 据 的 概念 主要 是 指 整 
型 、 实 型 或 布尔 型 等 数值 型 数据 ， 随 看 计算 机 软 人 硬件 的 发 展 和 计算 机 的 普及 ， 计 算 机 应 用 
领域 不 断 扩 大 ， 数 据 的 概念 已 逐步 扩展 到 字符 串 、 表 格 、 图 像 甚至 语言 等 。 

这 里 顺便 提 一 下 与 数据 密切 相关 的 另 一 个 概念 : 信息 。 简 单 地 说 ， 信 息 是 加 工 处 理 后 
的 数据 ， 是 数据 的 内 涵 ; 而 数据 是 信息 的 载体 ， 信 息 需 要 通过 数据 表示 出 来 。 如 A、B 两 
个 人 成 绩 分 别 是 85 和 95 分 ， 我们 得 到 的 信息 是 他 们 的 成 绩 都 较 好 ， 但 B 更 好 。 反 之 ， 为 
了 说 明 一 个 人 的 成 绩 好 ， 我 们 需要 给 出 具体 数据 ， 如 90 分 (或 与 之 相关 的 量 )。 但 有 时 数 
据 和 信息 并 不 严格 区 分 ， 如 数据 处 理 也 称 信息 处 理 。 

数据 元 素 (Data Element): 数据 的 基本 单位 ， 在 程序 中 作为 一 个 整体 加 以 考虑 和 人 处理 ， 
通常 具有 完整 确定 的 实际 意义 。 有 些 情况 下 ， 数 据 元 素 也 称 为 元 素 、 结 点 、 顶 点 或 记录 。 


数据 项 (Data Item): 数据 不 可 分 割 的 最 小 标识 单位 ， 具 有 独立 含义 ， 但 通 音 不 具有 和 完 
整 确定 的 实际 意义 ， 或 不 被 当做 一 个 整体 看 符 。 有 时 数据 项 也 称 为 字段 或 域 。 数 据 元 素 一 
般 由 硅 干 个 数据 项 组 成 ,但 有 时 也 可 只 含有 一 个 数据 项 。 

数据 、 数 据 元 隶 和 数据 项 反映 了 数据 组 织 的 三 个 层次 : 数据 可 由 奋 干 数据 元 素 组 成 ， 
数据 元 素 又 可 由 硅 干 数据 项 组 成 。 例 如 ， 对 例 1.2 的 部 门 机 构 组 织 问题 ， 数 据 即 指 所 有 部 
门 构成 的 整体 ， 其 中 每 个 部 门 就 是 一 个 数据 元 素 ， 因 为 在 此 问题 中 它 被 当做 运算 的 基本 单 
位 。 如 删除 、 插 入 等 运算 作用 的 对 象 吏 是 东 个 部 门 ， 不 是 整个 机 构 ， 也 不 是 茶 个 部 门 中 的 
个 别 项 目 。 部 门 的 名 称 、 编 写 等 项 目 则 为 数据 项 ， 它 们 只 表示 部 门 系 一 方面 的 信息 ， 在 本 
问题 中 单独 存在 时 没有 完整 确定 的 实际 意义 。 


1.2.2 ”数据 类 型 


数据 类 型 是 与 数据 结构 密切 相关 的 一 个 概念 。 它 最 早出 现在 高 级 程序 设计 语言 中 ， 用 
以 刻画 程序 中 操作 对 象 的 特性 。 在 用 高 级 语言 编写 的 程序 中 ， 每 个 变量 、 和 音量 或 表达 式 都 
有 一 个 确定 的 数据 类 型 。 

数据 类 型 (Data Type) 是 具有 相同 性 质 的 计算 机 数据 的 集合 及 在 这 个 数据 集合 上 的 一 
组 操作 的 总 称 ， 它 显 式 或 隐 式 地 规定 了 数据 的 取 值 范围 和 操作 特性 。 例 如 ，C/C++ 语 言 
的 无 符号 字符 型 (unsigned char) 代表 闭 区 间 [0, 255] 中 的 整数 ， 在 这 个 整数 集中 可 以 进行 
加 、 减 、 乘 、 整 除 、 取 模 等 操作 。 

数据 类 型 可 以 分 为 原子 类 型 和 结构 类 型 (或 称 导 出 类 型 、 复 合 类 型 )。 原 子 类 型 的 值 
是 不 可 分 解 的 ， 它 由 计算 机 语言 提供 ， 如 C/C++ 语言 中 的 整 型 、 字 符 型 等 ， 结 构 类 型 的 值 
是 可 分 解 的 ， 即 由 硅 干 成 分 组 成 ， 并 且 这 些 成 分 本 映 还 可 以 是 结构 的 。 结 构 类 型 要 借用 计 
算 机 语言 提供 的 数据 组 织 机 制 ， 由 用 户 自己 定义 ， 如 C/C++ 语言 中 的 结构 、 数 组 等 。 

抽象 数据 类 型 (Abstract Data Type，ADT) 是 指 一 个 数学 模型 以 及 定义 在 该 模型 上 的 一 
组 操作 的 总 称 。“ 抽 和 象 ” 的 含义 是 指 其 逻辑 特征 与 具体 的 软 便 件 实现 〈 即 计算 机 内 部 的 表示 
和 实现 ) 无 关 。 在 用 户 看 来 ， 无 论 怎样 实现 ， 只 要 其 数学 特征 不 变 ， 就 不 影响 其 外 部 使 用 。 

抽象 数据 类 型 和 数据 类 型 实质 上 是 一 个 概念 。 例 如 ， 各 种 计算 机 都 拥有 的 整数 类 型 就 
是 一 个 抽象 数据 类 型 ， 在 用 户 看 来 其 数学 特征 相同 ， 而 实际 上 它们 在 不 同 处 理 器 上 的 实现 
是 可 以 不 同 的 。 但 另 一 方面 ， 抽 和 象 数据 类 型 的 范畴 更 广 ， 它 不 局 限于 在 各 种 处 理 器 中 已 定 
义 并 实现 的 数据 类 型 ， 还 包 插 用户 目 己 定义 的 数据 类 型 。 

在 定义 抽象 数据 类 型 时 ， 将 一 组 数据 和 施加 于 这 些 数据 上 的 一 组 操作 封装 在 一 起 ， 用 
户 程序 只 能 通过 在 ADT 里 定义 的 茶 些 操作 来 访问 其 中 的 数据 ， 从 而 实现 了 信息 的 隐藏 。 
在 这 个 过 程 中 ， 数 据 的 表示 及 其 操作 的 细节 在 模块 的 内 部 给 出 ， 在 模块 的 外 部 使 用 的 只 是 
独立 于 具体 实现 的 抽象 的 数据 及 抽象 的 操作 。 上 所以， 抽象 数据 类 型 的 特征 是 使 用 与 实现 相 
分 离 ， 实 行 封装 和 信息 隐藏 。 


1.2.3 ”逻辑 结构 


为 了 表示 数据 间 的 关系 ， 需 要 引入 交 辑 结构 的 概念 。 
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数据 元 素 对 应 看 客观 世界 中 的 实体 ， 数 据 元 素 之 间 必 然 存 在 看 各 种 各 样 的 关系 ， 这 种 
数据 元 素 之 间 的 关系 就 称 为 结构 。 其 中 ， 数 据 元 素 之 间 的 关联 方式 (或 称 邻 接 关 系 〉 称 做 
数据 的 逻辑 关系 ， 数 据 元 素 之 间 远 辑 关 系 的 整体 称 为 逻辑 结构 (Logical Structure )。 

为 了 讨论 方便 ， 数 据 的 迎 辑 结构 一 般 可 用 示意 图 表示 。 具 体 方法 为 ， 用 小 圆圈 代表 数 
据 元 素 ， 用 小 圆 疾 之 间 的 连 线 代表 数 据 元 素 间 的 关系 ， 如 下 强调 关系 的 方 同 性 ， 可 用 市 入 
头 的 线段 表示 关系 。 有 四 类 基本 的 效 辑 结构 ， 如 图 1.2 所 示 。 
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(a) 集合 (b) 结 性 结构 (c) 树 状 结构 (d) 图 状 结构 


图 1.2 四 种 基本 逻辑 结构 示意 图 


(1) 集合 : 任何 两 点 之 间 不 考虑 邻接 关系 或 没有 邻接 关系 ， 或 称 做 没有 关系 的 关系 ， 
其 数据 组 织 形式 松 敌 ， 元 素 之 间 是 “平等 ”的 ， 它 们 的 共同 关系 是 “属于 同一 个 集合 ”。 也 
可 以 说 ， 集 合 中 各 元 素 之 间 除 了 “同属 于 一 个 集合 ”的 关系 外 ， 别 无 其 他 关系 。 

(2) 线性 结构 : 有 且 仅 有 一 个 开始 结 点 和 一 个 终端 结 点 ， 并 且 任 何 结 点 都 最 多 只 有 一 
个 直接 前 趋 和 一 个 直接 后 继 。 某 点 的 直接 前 趋 〈Immediate Predecessor) 是 指 与 之 相 邻 且 在 
它 前 面 的 结 点 ， 直 接 后 继 ‘(Immediate Successor) 是 指 与 之 相 邻 昌 在 其 后 的 结 点 。 开 始 结 
点 没有 前 趋 ， 终 问 结 点 没有 后 继 。 线 性 结构 中 数据 元 素 之 间 存 在 一 个 对 一 个 的 关系 。 

(3) 树 状 结构 : 除 一 个 特殊 元 素 〈 根 ) 外 ， 每 个 元 素 都 只 有 一 个 直接 前 趋 ， 但 可 有 多 
个 直接 后 继 ， 结 点 之 间 具 有 分 文 、 层 次 特性 。 树 状 结构 中 数据 元 素 之 间 存 在 一 个 对 多 个 的 
关系 。 

(4) 图 状 结 构 : 任何 两 点 之 间 都 可 能 邻接 ， 结 点 之 间 形 成 网 状 结构 。 任 一 元 素 都 可 有 
多 个 直接 前 趋 和 多 个 直接 后 继 ， 元 素 之 间 存 在 多 个 对 多 个 的 关系 。 

线性 结构 是 一 种 最 常见 的 数据 结构 ， 本 书 第 2 章 、 第 3 章 介 绍 的 线性 表 、 栈 、 队 列 、 
串 等 均 为 线性 结构 。 树 状 结构 与 图 状 结构 也 称 为 非 线 性 结构 ， 它 的 好 辑 特征 是 一 个 结 点 可 
能 有 多 个 直接 前 趋 或 多 个 直接 后 继 。 集合 比较 特殊 ， 可 把 它 归 到 非 线 性 结构 ， 因 为 “线性 ” 
之 外 都 是 “ 非 线性 ?”， 但 在 实际 使 用 时 ， 也 经 单 对 其 数据 元 素 增加 某 种 “线性 ”关系 ， 如 出 
现 的 先后 次 序 等 ， 按 线性 结构 处 理 〈 当 然 也 可 根据 需要 施加 某 种 “ 非 线 性 ”关系 ， 如 分 文 、 
层次 关系 等 ， 按 相应 的 非 线 性 结构 处 理 )。 

有 一 些 数据 结构 ， 如 多 维 数组 和 广义 表 ， 尽 管 本 质 上 属于 图 状 结构 ， 但 由 于 目 身 的 具 
体 特点 ， 与 图 状 结构 的 处 理 方法 有 很 大 不 同 ， 所 以 一 般 单独 讨论 。 

关于 逻辑 结构 ， 有 以 下 儿 点 需要 特别 注意 : 

(1) 风 辑 结构 与 数据 本 和 喘 的 形式 、 内 容 无 关 。 如 机 构 组 成 、 族 谱 管 理 等 问题 涉及 的 数 
据 ， 其 形式 、 内 容 完全 不 同 ， 但 都 是 树 状 结构 ; 而 同一 问题 ， 改 变 茶 个 元 素 的 名 称 或 内 容 ， 
迎 辑 结构 并 不 受 影 啊 。 

(2) 逻辑 结构 与 数据 元 素 的 相对 位 置 无 关 。 如 机 构 组 成 中 ， 进 行 部 门 关 系 重 组 ， 这 时 


结 点 间 的 相对 位 置 可 能 改变 ， 但 整体 上 仍 是 树 状 结构 。 

(3) 馆 辑 结构 与 押 合 结 点 的 个 数 无 天 。 如 不 同 的 机 构 组 成 ， 树 状 结构 中 结 点 数 不 同 ; 
而 同一 机 构 组 成 ， 增 加 或 删除 几 个 部 门 ， 其 结 打 仍 是 树 状 结构 。 

由 此 可 见 ， 一 些 表 面 上 很 不 相同 的 数据 可 以 有 相同 的 锡 辑 结构 ， 因 此 ， 滥 辑 结 构 是 数 
据 组 织 的 条 种 “本 质 性 ”的 东西 。 事 实 上 ， 逆 辑 结 构 是 数据 组 织 的 主要 方面 。 

在 不 全 于 混 消 的 情况 下 , 本 书 以 后 音 币 将 直接 前 趋向 称 为 前 趋 、 直接 后 继 简称 为 后 继 。 


1.2.4 ”存储 结构 


为 了 让 计算 机 对 数据 进行 处 理 ， 我 们 还 要 研究 如 何在 计算 机 中 表示 数据 。 数 据 的 存储 
实现 〈 机 内 表示 ) 称 为 数据 的 存储 结构 (Storage Structure) 或 物理 结构 ， 它 是 指数 据 元 素 
及 其 关系 在 计算 机 存储 器 内 的 表示 。 一 个 存储 结构 一 般 应 包括 3 个 内 容 : 

(1) 内 容 存储 。 存 储 各 数据 元 素 的 内 容 〈 值 )， 每 个 数据 元 素 占 据 独 立 的 可 访问 的 存 
储 区 。 

(2) 关系 存储 。 有 直接 或 间接 地 〈 显 式 或 隐 式 地 ) 存储 各 数据 元 素 间 的 人 好 辑 关系 。 

(3) 附加 存储 。 一 般 是 为 便于 运算 实现 而 设置 的 辅助 结 点 。 

其 中 ， 前 两 个 部 分 是 所 有 存储 结构 都 必须 具备 的 ， 第 三 个 部 分 则 根据 实际 需要 决定 是 
合 设 置 。 由 于 数据 元 素 内 部 的 组 织 形 式 一 般 比 较 人 简单， 内 容 存 储 也 束 比 较 简 单 ， 所 以 ， 逻 
辑 关 系 的 表示 是 存储 结构 的 主要 内 容 。 数 据 元 素 存 储 后， 元 素 间 的 逻辑 关系 便 由 存储 结 点 
间 的 关联 方式 间接 表示 。 

这 里 要 指出 ， 数 据 的 存储 结构 是 逻辑 结 构 用 计算 机 语言 的 实现 ， 它 依赖 于 计算 机 语言 
和 物理 设备 。 但 对 计算 机 语言 来 说 ， 存 储 结构 是 具体 的 ， 所 以 我 们 一 般 不 用 具体 的 物理 存 
储 地 址 来 换 述 存储 结构 ， 而 只 在 高 级 语言 的 层次 上 讨论 存储 结构 。 数 据 的 存储 结构 可 用 以 
下 4 种 基本 的 存储 方式 得 到 : 

(1) 顺序 存储 方式 。 所 有 结 点 相继 存放 到 一 上 连续 的 存储 区 中 ， 元 素 之 间 的 逻辑 关系 
通过 物理 位 置 天 系 间接 表示 。 由 此 得 到 的 存储 表示 称 为 顺序 存储 结构 (Sequential Storage 
Structure )， 它 是 一 种 最 基本 的 存储 方法 ， 通 常 价 助 程序 设计 语言 中 的 数组 来 换 述 。 该 方式 
主要 用 于 线性 结构 ， 非 线性 结构 需要 通过 某 种 线性 化 的 方法 来 实现 。 

(2) 链接 存储 方式 。 结 点 之 间 的 物理 位 置 不 一 定 连续 ， 它 们 之 间 的 逻辑 关 系 通过 附加 
的 指针 来 表示 。 即 每 个 元 素 的 存储 区 分 两 大 部 分 : 一 部 分 为 数据 区 ， 存 储 元 素 本 吴 的 数据 
内 容 ; 男 一 部 分 为 指针 区 ， 和 存储 与 其 他 元 素 之 间 的 关系 信息 (一 般 为 相关 的 其 他 元 素 的 地 
址 )。 由 此 得 到 的 存储 表示 称 为 链 式 存储 结构 (Linked Storage Structure )， 它 通常 借助 于 程 
序 设计 语言 中 的 指针 来 描述 ， 适 合 存储 复杂 的 数据 结构 。 

(3) 索引 存储 方式 。 在 存储 结 点 信息 的 同时 ， 还 建立 附加 的 索引 表 。 索 引 表 中 的 每 一 
项 称 为 案 引 项 ， 索 引 项 的 一 般 形式 是 : (关键 字 ， 地 址 )， 其 中 关键 学 是 能 标识 一 个 结 点 的 
那些 数据 项 。 硅 每 个 结 点 在 索引 表 中 都 有 一 个 索引 项 ， 则 该 索引 表 称 为 稠密 索引 (Dense 
Index)， 此 时 索引 项 地 址 指出 该 结 点 所 在 的 存储 位 置 ; 大 一 组 结 点 在 索引 表 中 只 对 应 一 个 
索引 项 ， 则 该 索引 表 称 为 稀 朴 索引 (Sparse Index)， 此 时 索引 项 的 地 址 指示 一 组 结 点 的 起 
始 存储 人 位置。 索引 存储 并 不 强调 关系 的 存储 ， 而 是 针对 数据 内 容 的 ， 主 要 面 癌 检索 〈 答 找 ) 
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操作 。 
(4) 散 列 存储 方式 。 以 结 点 的 关键 字 值 为 自 变量 ， 通 过 某 个 函数 计算 出 该 结 点 的 存储 
位 置 (或 位 置 区 间 端 点 )。 这 个 函数 称 为 散 列 函数 。 散 列 存储 也 是 面向 内 容 存储 的 。 
实际 上 ,在 这 4 种 存储 方式 中 ,顺序 存储 方式 和 链接 存储 方式 是 最 基本 的 ， 因 为 索引 存 
储 方式 和 散 列 存储 方式 在 具体 实现 时 需要 利用 前 两 种 结构 ， 也 可 看 成 前 两 种 结构 的 衍生 。 
上 述 四 种 存储 方法 ， 既 可 以 单独 使 用 ， 也 可 以 组 合 使 用 。 有 时 同一 种 迎 辑 结构 可 采用 不 
同 的 存储 结构 ， 如 何 选择 要 视 具体 要 求 而 定 ， 主 要 是 考虑 运算 的 方便 性 及 算法 的 时 空 要 求 。 


1.2.5 运算 


为 了 完成 数据 处 理 任 务 ， 需 要 引入 运算 的 概念 。 

一 般 地 ， 运 算是 指 在 馆 辑 结构 上 施加 的 操作 ， 即 对 包 辑 结构 的 加 工 。 运 算 与 馆 辑 结构 
紧密 相连 ， 每 种 逻辑 结构 都 有 一 个 运算 的 集合 。 运 算 的 种 类 很 多 ， 随 不 同 的 应 用 而 不 同 。 
根据 操作 的 结果 ， 运 算 可 分 为 两 种 类 型 ， 

(1) 加工 型 运算 ， 其 操作 改变 了 原 效 辑 结 构 的 “ 值 ”， 如 结 点 个 数 、 结 点 内 容 等 。 

(2) 引用 型 运算 ， 其 操作 不 改变 原 风 辑 结构 ， 只 从 中 提取 某 些 信息 。 

例如 ， 在 例 1.2 的 树 状 结构 S 上， 一 般 可 定义 以 下 运算 : 

。 查找 。 引 用 型 运算 ， 在 $ 中 寻找 满足 一 定 条 件 的 结 点 。 

。 插 入。 加工 型 运算 ， 在 S 的 指定 位 置 上 添加 新 的 结 点 。 

e。 删除 。 加 工 型 运算 ， 删 去 S 的 茶 个 指定 结 点 。 

。 读 取 。 引 用 型 运算 ， 读 取 S$ 中 某 指 定位 置 上 结 点 的 内 容 。 

。 更 新 "”。 加 工 型 运算 ， 更 新 S 中 某 指定 结 点 的 内 容 。 

。 通 历 。 引 用 型 运算 ， 按 某 种 方式 访问 S 中 各 结 点 ， 使 得 每 个 结 点 恰好 被 访问 一 次 。 

。 关系 访问 。 引 用 型 运算 , 访问 S 中 特定 关系 的 结 点 ， 比 如 结 点 的 上 下 级 、 同 级 结 点 等 。 

根据 实际 需要 ， 可 对 这 些 运 算 进 行 增 减 。 

在 各 种 运算 中 ， 如 果 某 些 运 算 ， 它 的 实现 不 能 利用 其 他 运算 ， 而 其 他 运算 可 以 或 需要 
利用 该 运算 ， 则 这 些 运算 称 为 基本 运算 。 如 上 面 的 更 新 运算 就 不 是 基本 运算 ， 因 为 在 更 新 
时 ， 可 先 利 用 查找 运算 ， 找 到 该 该 点 后 再 更 改 有 关内 容 (或 删除 原 结 点 ， 再 插入 新 结 点 ); 
而 查找 运算 是 基本 运算 ， 它 不 能 利用 其 他 运算 。 每 种 逻辑 结构 都 有 目 己 的 基本 运算 集 ， 光 
辑 结构 不 同 ， 基 本 运算 集 一 般 也 不 同 。 

一 般 地 , 我 们 将 较 复 杂 的 运算 分 解 为 奋 干 较 简 单 的 运算 , 有 利于 降低 程序 设计 的 难度 ， 
同时 也 有 利于 提高 程序 设计 的 效率 。 在 简单 运算 中 ， 再 分 解 出 一 些 基本 运算 ， 当 基本 运算 
实现 后 ， 其 他 运算 就 可 通过 调用 基本 运算 来 实现 ， 进 而 完成 整个 程序 。 


1.2.6 ”算法 


数据 的 运算 是 定义 在 迪 辑 结构 上 的 ， 只 指出 “做 什么 ”， 而 不 考虑 “怎么 做 ”。 运 算 实 


(D 有 的 文献 用 “修改 ”。 但 更 新 或 修改 本 身 并 不 专 指 结 点 内 容 的 改动 ， 只 要 有 变动 都 可 ， 如 更 新 或 
修改 数据 库 ， 可 能 是 对 其 记录 的 插入 、 删 除 以 及 内 容 改 动 等 。 本 书 中 “更 新 ”主要 指 结 点 内 容 的 更 改 ， 
修改 则 可 指 各 种 情况 的 改动 (具体 看 上 下 文 )。 


现 的 这 个 细节 问题 就 是 算法 。 算 法 是 与 数据 结构 密切 相关 的 一 个 概念 ， 讨 论 某 种 数据 结构 
必然 会 涉及 相应 的 算法 ， 而 设计 某 个 算法 也 必然 要 涉及 有 具体 的 数据 结构 。 

所 谓 算法 (Algorithm)， 通 俗 地 讲 ， 就 是 解决 特定 问题 的 方法 和 步骤 ， 较 严格 地 说 ， 
就 是 规则 的 有 穷 集合 ， 这 些 规则 规定 了 一 个 指令 的 有 限 序 列 ， 其 中 每 条 指令 表示 一 个 或 多 
个 操作 。 一 个 算法 必须 满足 下 述 准则 : 

(1) 输入 。 具 有 和 零 个 或 多 个 输入 ， 它 们 是 算法 开始 前 的 初始 量 。 

(2) 输出 。 至 少 产生 一 个 输出 ， 它 们 是 与 输入 有 某 种 关系 的 量 ， 是 算法 的 执行 结果 。 

(3) 有 穷 性 。 算 法 的 执行 步骤 〈 或 每 条 指令 的 执行 次 数 ) 必须 是 有 限 的 ， 整 个 算法 必 
须 在 有 限 步 (或 有 限 条 指令 ) 后 结束 。 

(4) 确定 性 。 算 法 每 一 步 (或 每 条 指令 ) 的 含义 都 必须 明确 ， 无 二 义 性 。 

(5) 可 行 性 ”"。 算 法 每 一 步 (或 每 条 指令 ) 是 可 执行 的 ， 并 且 执 行 时 间 是 有 限 的 ， 整 
个 算法 必须 在 有 限时 间 内 完成 2。 

这 里 要 注意 , 本 课程 所 指 的 算法 是 针对 数据 结构 的 , 而 一 般 问题 的 算法 是 面向 应 用 的 ， 
它 涉及 数据 结构 的 应 用 ， 但 范围 比 数据 结构 中 的 运算 要 广 。 

男 外 ， 算 法 与 程序 的 含义 很 相似 ， 但 二 者 是 有 区 别 的 : 

(1) 程序 不 一 定 满足 有 穷 性 ， 即 不 一 定 是 算法 。 如 操作 系统 就 不 是 一 个 算法 ， 因 为 只 
要 不 遭 破 坏 ， 它 就 永远 不 会 停止 ， 即 使 没有 作业 要 处 理 ， 它 仍 处 于 等 竺 循环 中 《不 过 操作 
系统 内 部 每 个 具体 任务 的 实现 都 应 是 一 个 算法 )。 一 个 程序 如 果 对 任何 输入 都 不 会 陷入 无 限 
循环 ， 就 是 一 个 算法 。 

(2) 程序 中 的 指令 必须 是 机 器 可 执行 的 ， 而 算法 中 的 指令 虽 要 求 可 执行 ， 但 不 一 定 是 
“机 器 可 执行 >。 如果 一 个 算法 用 机 器 可 执行 的 语言 来 书写 ， 则 它 就 是 一 个 程序 ， 即 该 算法 
在 计算 机 上 的 特定 实现 。 

任何 算法 都 必须 用 茶 种 方法 描述 出 来 ， 即 将 算法 中 的 操作 及 其 执行 顺序 〈 人 简称 算法 两 
要 素 ) 描述 出 来 ， 其 中 常用 的 就 是 用 语言 描述 。 根 据 描述 语言 的 不 同 ， 一 般 可 将 算法 分 为 
以 下 三 类 : 

(1) 运行 终止 的 程序 可 执行 部 分 “”。 采 用 计算 机 程序 设计 语言 描述 ， 可 直接 在 计算 机 
上 运行 ， 从 而 使 给 定 问 题 在 有 限时 间 内 被 机 械 地 求解 。 这 类 算法 比较 严谨 ， 但 要 熟悉 计算 
机 语言 ， 有 一 定 难 度 ， 也 不 太 直 观 ， 常 党 需要 通过 注释 来 提高 可 读 性 。 

(2) 伪 语 言 算 法 。 采 用 伪 程 序 设计 语言 描述 ， 不 能 直接 在 计算 机 上 运行 。 伪 语言 介 于 
程序 设计 语言 和 目 然 语 言 之 间 ， 它 忽略 程序 设计 语言 中 一 些 严 格 的 语法 规则 和 细节 摘 述 ， 
因此 伪 语 言 描述 可 突出 算法 设计 的 主要 方面 而 不 是 语法 细节 ， 又 比 自 然 语 言 更 接近 程序 。 
伪 语 言 算 法 一 般 比 较 简 洁 ， 便 于 编写 和 陪读， 适合 于 教学 和 交流 ， 同 时 也 容易 修改 成 程序 。 

(3) 非 形式 算法 。 采 用 自然 语言 ， 同 时 还 可 夹杂 使 用 程序 设计 语言 或 伪 程 序 设 计 语言 
(如 流程 控制 语句 whileg、for、 计 等 ) 描述 。 这 类 算法 简单 易 懂 ， 但 不 够 严谨 。 


Q) 有 的 文献 用 “有 效 性 ”。 显 然 不 可 执行 的 指令 是 无 效 的 。 

@@ 有 的 文献 把 执行 时 间 的 有 限 性 归 入 到 “有 穷 性 ”。 男 外 ， 时 间 的 有 限 性 应 该 在 合理 的 范围 内 ， 如 
需 耗 时 白 年 的 计算 一 般 不 会 认为 是 可 行 的 。 

(3) 这 里 不 写 “ 程 序 语 言 算法 ”是 指 去 除 其 中 的 非 执 行 部 分 ， 如 变量 和 函数 的 说 明 语 句 等 。 
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算法 除了 用 语言 描述 外 ， 实 际 上 还 有 一 种 图 形 描述 方法 ， 如 流程 图 、N-S 图 等 ， 这 种 
拉 述 更 加 简单 明了 。 但 我 们 只 把 它 看 做 语言 描述 的 一 个 辅助 手段 ， 并 且 它 最 终 还 是 要 用 语 
言 描述 出 来 。 

不 管 算法 用 什么 方法 描述 ， 它 最 终 都 要 转换 为 程序 才能 在 计算 机 上 运行 。 上 述 几 种 描 
述 方法 的 可 读 性 依次 增强 ， 但 可 读 性 越 剖 ， 离 最 终 程 序 的 距离 越 远 。 对 一 些 较 复杂 问题 ， 
一 次 性 地 写 出 它 的 程序 比较 困难 ， 一 般 是 先 写 出 伪 语 言 算法 或 非 形式 算法 ， 骨 通过 “逐步 
求 精 ”的 过 程 转化 为 实际 程序 。 逐 步 求 精 的 过 程 也 符合 人 们 认识 事物 的 思维 活动 。 

原则 上 说 ， 任 何 算法 都 可 以 用 任 一 种 程序 设计 语言 来 实现 ， 但 显然 具体 实现 的 难 易 程 
度 和 效果 会 有 所 不 同 。 随 看 面 癌 对 象 程序 设计 语言 的 流行 ， 数 据 结构 中 越 来 越 多 地 出 现 了 
这 关 语 言 的 描述 ， 如 C++ 搬 述 等 。 应 该 说 ， 为 了 较 好 地 插 述 数据 结构 ， 特 别 是 抽象 数据 类 
型 ， 以 及 较 好 地 解决 代码 重用 等 问题 ， 这 样 做 是 有 利 的 。 但 这 同时 也 对 读者 提出 了 更 局 的 
和 要求， 读者 必须 较 好 地 掌握 了 面 加 对象 的 程序 设计 知识 ， 人 否则 可 能 出 现 数据 结构 的 内 容 不 
突出 ， 面 加 对 象 的 内 容 倒 成 了 问题 的 重点 和 难点 。 男 外 ， 类 的 构造 、 析 构 、 继 承 和 派生 、 
重 载 、 多 态 、 模 板 等 面 则 对 和 象 的 概念 和 方法 引入 后 ， 数 据 结构 的 内 容 常 党 显得 复杂 和 “ 融 
深 ” 起 来 ， 在 使 用 中 很 多 初学 者 都 感到 比较 困难 。 

为 了 突出 数据 结构 本 喘 的 内 容 而 义 不 过 于 强调 语言 的 细节 ， 有 些 教材 采用 了 伪 语 言 ， 
如 类 C 等 。 但 伪 语言 算法 毕竟 还 要 转换 成 程序 语言 算法 ， 其 中 除了 语法 上 的 不 严格 外 ， 伪 
语句 和 实际 语句 上 的 差别 也 经 党 引起 程序 问题 ， 如 调用 程序 和 被 调用 程序 间 的 信息 是 双 问 
传递 还 是 单 同 传递 等 。 

本 书 对 数据 结构 的 描述 采用 了 C/C++ 语言 ， 即 主体 部 分 为 C 语言 ， 但 对 输入 输出 、 安 
常量 、 注 释 、 动 态 内 存 分 配 和 释放 等 采用 了 比较 人 简洁 的 C++ 扩展 形式 ， 如 表 1.1 所 示 。 

表 1.1 C/C++ 语句 对 比 


C 语句 C++ 语句 
#include <stdio.h> #include <iostream.h> 
scanf (“S$d%$c’”, &1,&ch); CINSSIIYSChs 
Dein Se nL Ch cout<<i<<ch<<endl; 
#define maxsize 100 const int maxsize=100; 
for (i=0;i<n;i++) Ss=s+a[i];/* 元 素 求 和 x*/ | for (i=0;i<n;i++) s=s+a[i];// 数 组 元 素 求 和 
int *p,*q; int *p,*q; 
p=malloc (10*sizeof (int)); p=new int[10]; // 动 态 分 配 10 个 整数 空间 (数组 ) 
gq=malloc (sizeof (int)); gq=new int; // 动 态 分 配 1 个 整数 空间 
free (p); delete []p;  // 释 放 数 组 空间 
free (9) ; delete q; 


C++ 还 新 增 了 一 个 功能 一 一 引用 ， 它 在 参数 传递 上 很 方便 ， 由 于 没有 对 应 的 C 语句 ， 
本 书 暂 未 采用 ， 但 作为 附录 (附录 B) 供 参考 。 

由 于 采用 了 C 的 扩展 部 分 ， 所 以 上 机 时 需 采 用 C++ 编译 器 〈 如 Turbo C++ 3.0 等 )。 有 
关 这 些 扩展 的 详细 知识 ， 请 参考 C/C++ 语 言 的 有 关 资 料 。 


全 于 C++ 的 主要 扩展 一 一 兴 ， 本 书 则 未 采用 《〈 忌 因 前 已 叙 及 )。 实 践 表明 ， 和 掌握 了 数 
据 结构 的 基本 知识 和 方法 后 ， 可 以 非常 方便 地 应 用 到 C++ 等 面 癌 对 象 的 程序 设计 中 。 


1.2.7 ”数据 结构 


前 面 介 绍 了 数据 结构 相关 的 几 个 概念 ， 但 一 直 没 有 说 究竟 什么 是 数据 结构 。 事 实 上 ， 
对 数据 结构 这 一 概念 ， 目 前 也 没有 一 致 公认 的 定义 。 比 较 流 行 的 观点 有 两 种 。 一 种 观点 认 
为 ， 一 个 数据 结构 是 由 一 个 多 辑 结构 S、 一 个 定义 在 S 上 的 基本 运算 集 A 和 S 的 一 个 存储 
实现 D 所 构成 的 整体 (S$，A , D); 男 一 种 观点 认为 , 一 个 数据 结构 是 由 一 个 多 辑 结构 S 和 定 
义 在 S 上 的 一 个 基本 运算 集 A 构成 的 整体 (S$，A )。 本 书 采 用 了 前 一 种 观点 ， 将 数据 的 逻辑 
结构 、 数 据 的 存储 结构 及 数据 的 运算 这 三 方面 看 成 一 个 有 机 的 整体 ， 这 样 ， 数 据 结 构 的 定 
义 为 : 

数据 结构 (Data Structure) 是 指 相互 间 存 在 大 一 种 或 多 种 关系 的 数据 元 素 的 集合 ， 它 
们 按照 某 种 逻辑 关系 组 织 起 来 ， 并 用 计算 机 语言 ， 按 一 定 的 存储 方式 存储 在 计算 机 的 存储 
器 中 ， 同 时 在 这 些 数 据 上 定义 了 一 个 运算 的 集合 。 简 单 地 说 ， 一 个 数据 结构 就 是 一 类 数据 
的 表示 及 其 相关 操作 ， 它 一 般 包括 三 个 方面 的 内 容 : 数据 的 滥 辑 结构 、 数 据 的 存储 结构 、 
数据 的 运算 。 

在 不 产生 混 清 的 情况 下 ， 也 党 将 数据 的 逻辑 结构 人 简称 为 数据 结构 。 

数据 的 逻辑 结构 是 数据 本 身 所 固有 的 ， 与 计算 机 无 关 。 每 种 逻辑 结构 都 有 目 己 的 一 组 
基本 运算 ， 它 规定 了 数据 的 基本 操作 方式 。 这 里 的 数据 是 指 具体 问题 中 要 处 理 的 对 象 ， 运 
算 也 来 源 于 具体 问题 的 处 理 要 求 。 由 一 种 逻辑 结构 和 一 组 基本 运算 构成 的 整体 ， 与 数据 的 
存储 无 关 ， 也 是 独立 于 计算 机 的 ， 可 看 成 是 从 具体 实际 问题 抽象 出 来 的 数学 模型 。 将 数据 
以 及 数据 间 的 逻辑 关 系 存储 起 来 后 ， 束 得 到 了 存储 结构 。 数 据 的 运算 定义 在 包 辑 结构 上 ， 
只 指出 “做 什么 ”， 而 不 考虑 “怎么 做 ”， 当 确定 了 存储 结构 后 ， 才 能 考虑 如 何 将 运算 具体 
实现 ， 即 “怎么 做 ”， 这 就 是 算法 问题 。 由 于 存储 结构 是 好 辑 结 构 的 实现 ， 算 法 是 运算 的 实 
现 ， 所 以 ， 也 可 以 认为 数据 结构 的 基本 任务 斌 是 数据 结构 的 设计 和 实现 。 

前 和 面 已 指出 ， 程 序 设计 的 实质 是 数据 表示 和 数据 处 理 。 在 上 述 逻 辑 结构 和 运算 组 成 的 
数学 模型 中 ， 数 据 还 只 是 机 外 表示 。 要 完成 数据 表示 和 数据 处 理工 作 ， 还 要 将 此 模型 用 计 
算 机 程序 实现 ， 即 还 必须 研究 数据 的 存储 实现 和 运算 实现 。 存 储 实现 就 是 把 所 有 数据 及 其 
相互 关系 存储 起 来 ， 即 完成 数据 的 表示 工作 ; 运算 实现 就 是 在 存储 结构 上 完成 具体 的 处 理 
过 程 并 得 到 完整 的 程序 ， 即 完成 数据 的 处 理工 作 。 以 上 有 关 概 念 间 的 关系 可 用 图 1.3 表示 。 


建 模 “| 罗 名 结构 | ,求生 


问题 数学 模型 实现 


1.3 数据 结构 的 主要 内 容 


图 1.3 实际 上 也 是 从 数据 结构 的 观点 来 看 一 个 程序 的 设计 过 程 : 首先 从 具体 问题 中 抽 
象 出 一 个 适当 的 数学 模型 ， 然 后 设计 一 个 解 此 模型 的 算法 ， 最 后 编程 、 调 试 、 运 行 直 到 最 
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终 获 解 。 其 中 ， 寻 求 数 学 模型 的 实质 是 分 析 问 题 ， 从 中 提取 操作 的 对 象 ， 并 找 出 它们 之 间 
的 关系 ， 然 后 加 以 描述 。 这 个 模型 对 非 数值 问题 ， 一 般 不 能 用 数学 方程 来 描述 ， 而 是 采用 
诸如 线性 表 、 树 和 图 之 类 的 逻辑 结 构 及 其 运算 要 求 来 描述 。 

图 1.3 也 说 明了 一 个 程序 设计 过 程 是 渐进 的 ， 体 现在 两 个 方面 : 

(1) 数据 表示 是 逐步 完成 的 : 机 外 表示 一 旬 辑 结构 一 存储 结构 。 

(2) 数据 处 理 也 是 逐步 完成 的 : 处 理 要 求 一 基本 运算 一 算法 。 

其 中 ， 数 据 表 示 和 数据 处 理 是 密切 相关 的 ， 数 据 处 理 方 式 总 是 与 数据 的 东 种 相应 的 表 
未 形式 相 联 系 ， 反 之 亦 然 。 

对 一 个 数据 结构 , 将 其 三 个 方面 的 内 容 搞 消 楚 了， 也 就 搞 消 楚 了 这 个 数据 结构 。 为 外 ， 
这 三 方面 中 即使 只 有 茶 一 个 不 同 ， 我 们 也 将 其 称 做 不 同 的 数据 结构 。 例 如 ， 线 性 表 是 一 种 
逻辑 结构 ， 硅 采用 顺序 存储 方式 则 称 为 顺序 表 ; 大 采用 链接 存储 方式 则 称 为 链表 。 又 如 ， 
对 线性 表 上 的 插入 、 删 除 运算 如 果 限 制 在 表 的 一 端 进行 ， 则 称 为 栈 : 知 插入 限制 在 表 的 一 
哨 进行， 删除 限制 在 表 的 另 一 端 进行 ， 则 称 队列 ;更 进一步 ， 大 栈 和 队列 采用 顺序 存储 方 
式 或 链接 存储 方式 ， 则 分 别称 为 顺序 栈 或 链 栈 、 顺 序 队 列 或 链 队 列 。 

数据 结构 也 可 用 集合 论 的 观点 来 定义 ， 即 将 数据 结构 看 成 由 知 干 集合 组 成 ， 如 : 数据 
(网 辑 ) 结构 是 一 个 二 元 组 (D,R)， 其 中 了 是 具有 相同 特性 的 数据 元 素 的 有 限 集 , R 是 D 上 
的 关系 的 有 限 集 。 这 里 的 关系 可 简单 地 理解 为 D 中 元 素 的 有 效 序 偶 <di d> 集 。 其 中 ， 称 di 
为 di 的 《直接 ) 后 继而 di 为 的 (和 直接 ) 前 趋 。 这 种 表示 法 有 集合 论 的 理论 基础 ， 质 述 
严密 ， 易 于 使 用 数学 方法 研究 ， 但 不 直观 ， 有 时 也 很 烦琐 ， 本 书 没 有 采用 《但 对 图 结构 有 
用 了 这 种 插 述 )。 


(1.3、 算法 分 析 


1.3.1 算法 的 评价 


一 般 而 言 ， 同 一 个 问题 可 设计 出 许多 不 同 的 算法 ， 这 些 算法 讨 优 热 劣 、 如 何 选择 ， 残 
涉及 算法 的 评价 问题 。 通 利 可 从 下 列 几 个 方面 评价 算法 《包括 程 序 ) 的 质量 。 

(1) 正确 性 。 指 算法 应 正确 实现 预定 的 功能 〈 即 处 理 要 求 )。 关 于 算法 的 正确 性 ， 一 
般 不 进行 形式 化 的 证 明 ， 而 是 用 测试 来 验证 。 这 主要 是 因为 实际 问题 的 复杂 性 ， 证 明 起 来 
非 第 困难 。 在 测试 时 ， 用 精心 选 定 的 大 干 合 法 输入 来 运行 算法 ， 检 僵 其 结果 是 否 正 确 。 不 
过 ， 正 如 著名 的 计算 机 科学 家 E.Dijkstra 所 说 的 那样 ,，“ 测 试 只 能 指出 有 和 错误， 而 不 能 指出 
不 存在 错误 ”。 

(2) 易 读 性 。 指 算法 能 被 理解 的 难 易 程 度 ， 如 思路 清晰 、 层 次 分 明 、 简 单 明 了 等 。 现 
在 人 们 比较 强调 易 谈 性 ， 因 为 上 只 有 算法 便于 阅读 和 理解 ， 才 便于 交流 、 推 广 和 使 用 ， 也 便 
于 调试 、 修 改 和 扩展 ， 以 及 及 早 发 现 隐藏 的 错误 。 

(3) 健壮 性 。 指 算法 对 总 外 情况 (如 输入 数据 非法 、 内 存 人 不足、 文件 打开 失败 、 读 写 
失败 等 ) 能 适当 地 作出 反应 或 进行 处 理 ， 不 会 产生 不 需要 的 其 全 严重 的 运行 结果 。 比 如 在 输 
入 一 个 整数 时 ， 意 外 地 输入 了 一 个 字符 ， 程 序 会 怎样 ? 会 不 会 产生 奇怪 的 结果 ? 


(4) 高 效率 。 指 算法 上 应 有 较 好 的 时 空 性 能 。 

这 些 指标 一 般 很 难 做 到 十 全 十 美 ， 因 为 它们 常常 互相 冲突 ， 故 在 实际 评价 中 应 根据 需 
要 有 所 侧重 。 在 数据 结构 中 主要 讨论 算法 的 时 容 性 能 ， 这 并 不 意味 看 这 一 指标 比 其 他 指标 
更 重要 (实际 可 能 恰恰 相反 )， 而 是 读 程 的 性 质 和 内 容 押 决定 的 。 确 定 一 个 算法 时 空 性 能 六 
工作 称 为 算法 分 析 。 

算法 的 时 空 性 能 是 指 算法 的 时 间 性 能 和 空间 性 能 ， 前 者 指 算法 的 时 间 耗 费 ， 即 包含 的 
计算 量 ;， 后 者 指 算法 需要 的 存储 量 。 算 法 的 时 间 耗 费 也 称 时 间 复 杂 性 或 时 间 复 杂 度 〈Time 
Complexity); 类 似 ， 算 法 的 空间 耗费 也 称 空 间 复 杂 性 或 空间 复杂 度 (Space Complexity ) 。 

同一 问题 因 所 采用 的 数据 结构 不 同 ， 相 应 算法 的 效率 会 有 所 不 同 ; 反之 ， 由 算法 的 执 
行 效率 也 可 反映 数据 结构 的 好 坏 。 算 法 分 析 是 数据 结构 课程 的 重要 内 容 之 一 。 


1.3.2 ”时 间 复 杂 度 


算法 所 耗费 的 时 间 ， 应 该 是 算法 中 所 有 语句 执行 时 间 之 和 ， 而 每 条 语句 的 执行 时 间 是 

该 语句 的 执行 次 数 〈 即 频 度 ，Frequency Count) 与 该 语句 执行 一 次 所 需 时 间 的 乘积 。 即 
T= > 〈 频 度 X 每 次 时 间 ) 
语句 i 

但 算法 转换 为 程序 后 ， 每 条 语句 执行 一 次 的 时 间 与 所 处 的 软 人 硬件 环境 有 关 : 

(1) 硬件 因素 。 主 要 是 机 器 的 指令 性 能 和 速度 ， 比 如 32 位 机 一 般 比 16 位 机 运行 快 ; 
主 频 2GHz 的 机 器 一 般 比 S00MHz 的 机 器 快 ; 磁盘 的 速度 一 般 比 磁 市 快 等 。 

(2) 软件 因素 。 这 又 包括 语言 因素 、 编 译 质量 、 操 作 系 统 等 。 如 汇编 语言 的 执行 效率 
一 般 高 于 高 级 语言 ， 编 译 器 不 同 (如 TC、VC 等 )， 以 及 不 同 的 编译 选项 (如 优化 代码 大 
小 和 优化 代码 速度 等 ) 得 到 的 代码 也 会 不 同 。 操 作 系 统 对 执行 时 间 也 有 影响 ， 如 一 般 
Windows 系统 下 的 执行 效率 快 于 DOS 系统 等 。 

这 些 因 素 在 一 般 情 况 下 是 很 难 确 定 的 ， 所 以 我 们 难以 算出 算法 的 绝对 时 间 ， 并 且 这 个 绝 
对 时 间 随 着 运行 环境 的 不 同 也 不 同 。 这 使 得 用 绝对 时 间 来 评价 算法 的 效率 既 不 合适 ， 也 没有 
意义 了 >。 为 了 突出 算法 本 身 的 性 态 而 排除 算法 外 的 其 他 因素 〈( 即 软 硬 件 因素 )， 这 里 假定 每 条 
语句 只 是 抽象 地 运行 ， 不 依赖 于 某 个 具体 的 计算 机 软 硬 件 环 境 ， 并 由 此 进一步 假定 每 条 语句 
执行 一 次 的 时 间 均 是 单位 时 间 。 于 是 ， 一 个 算法 的 时 间 耗 费 就 是 该 算法 中 所 有 语句 的 频 度 之 
和 。 这 样 ， 就 可 以 独立 于 具体 机 器 的 软 硬 件 条 件 来 分 析 算 法 本 和 喘 的 时 间 耗 费 了 。 为 了 区 别 ， 
不 妨 把 这 种 时 间 称 为 逻辑 时 间 。 

需要 注意 的 是 ， 这 里 的 “语句 ” 指 的 是 描述 算法 的 基本 语句 ， 它 的 执行 ， 在 语法 意 
义 上 讲 应 是 不 可 再 分 割 的 。 换 句 话说 ， 循 环 语句 的 整体 、 函 数 调用 语句 等 就 不 能 算 作 基 本 
语句 ， 因 为 它们 还 包括 由 多 个 语句 组 成 的 循环 体 或 函数 体 。 

例 1.3 计算 x。 


GO 这 是 指 对 绝对 时 间 进 行事 前 估计 。 为 一 种 方法 是 事后 统计 ， 即 测试 算法 在 实际 计算 机 上 的 运行 时 
间 。 这 可 考察 算法 在 具体 计算 条 件 下 的 实际 性 能 及 不 同 算法 间 实 际 性 能 的 差异 ， 但 在 计算 条 件 变 化 后 这 
些 结果 会 有 变化 。 下 述 逻 辑 时 间 的 分 析 属 于 事前 估计 ， 但 也 可 在 实际 运行 时 对 有 关 语 句 进 行 统 计 ， 即 事 
后 统计 (参见 附录 C 排序 算法 的 时 间 统 计 )。 
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解 : 如 果 直 接 计 算 x “一 x*x*…*x， 则 要 做 31 次 乘法 。 

如 果 考 虑 到 x>*=((((x”)”)》， 即 每 次 在 平方 ( 自 乘 ) 的 基础 上 再 平方 ， 则 只 需要 5 次 
乘法 。 

又 如 ， 计 算 x ， 它 可 通过 x“/x 得 到 。 若 不 允许 用 除法 ， 则 不 能 直接 用 连续 平方 的 方 
法 ， 如 果 考 虑 x !=x(x(x(x(x))”)》， 则 也 只 需 8 次 乘法 ， 而 不 是 30 次 。 

可 见 ， 对 同一 问题 ， 不 同 算法 的 效率 可 能 是 不 同 的 ， 甚 至 相差 很 大 。 

例 1.4 计算 两 个 方 阵 的 乘积 Caxn=AnxnXBnaxn。 


解 : 
for (1=0;1<n;1++) //n+l 
for (]=07]J<nz]++) { //n (n+l) 
c[1i] [jl]=0; Fin 
for (Kk=0; k<n; k++) //n’ (n+1) 
c[1I][]]=c[I][]]+a[I] [K]*b[k] [J]; Rn 
} 


其 中 右边 列 出 了 各 语句 的 频 度 。 注 意 ， 对 语句 for(i=0; i<n; i++H) 等 "， 虽 然 它 控制 循环 
体 执 行 了 n 次 ， 但 它 目 己 却 执 行 了 n+l 次 。 这 是 因为 循环 条 件 i<n 检测 了 n+l 次 : 前 n 次 
检测 时 该 条 件 成 立 ， 最 后 一 次 检测 时 该 条 件 不 成 立 〈 此 时 Fn， 循 环 结束 )。 算 法 的 时 间 耗 
费 为 各 语句 的 频 度 之 和 |: 

T(n)=(n+l)+n(nt+l)+n +n (nt+1)+n =2n +3n +2n+l (1.1) 
可 见 ， 它 是 算 阵 阶 数 n 的 函数 。 

一 般 地 ， 我 们 将 问题 输入 数据 量 或 初始 数据 量 ) 的 大 小 ， 或 与 之 相关 的 菏 个 量 ， 称 
为 问题 的 规模 〈Size， 大 小 )， 并 用 一 个 整数 表示 。 例 如 ， 和 矩阵 乘积 问题 的 规模 是 和 矩阵 的 阶 
数 ， 而 一 个 图 论 问题 的 规模 则 是 图 中 的 项 点数 或 边 数 。 一 个 算法 的 时 间 复 杂 度 可 以 描述 为 
输入 规模 的 函数 空间 复杂 上 度 也 是 如 此 )。 在 以 后 的 讨论 中 ， 我 们 一 般 用 TD 表示 时 间 复 
杂 度 、S(n) 表 示 宇 间 复 杂 度 ， 其 中 必 为 问题 的 规模 。 

填空 复杂 上 度 的 准确 表示 和 负 第 是 件 非 间 困难 的 事 ， 因 为 很 多 算法 的 时 间 复 杂 上 度 难以 给 出 
解析 形式 ， 或 者 非常 复杂 。 然 而 ， 我 们 看 到 ， 当 问题 规模 较 大 时 ， 复 杂 度 表示 式 中 实际 上 
只 有 一 些 占 主导 地 位 的 项 有 意义 ， 当 n 较 大 如 n=100 时 , 式 (1.1) 中 只 有 高 次 项 2n 有 意义 ， 
其 他 低 次 项 可 忽略 不 计 。 所 以 ， 人 们 往往 放弃 寻求 确切 的 时 空 复杂 上 度 函 数 的 企图 ， 而 通常 
用 东 些 简单 函数 来 近似 表示 其 大 致 性 能 ， 这 束 是 时 空 复杂 度 的 渐 近 表示 。 

当 问 题 的 规模 n 趋 问 无 穷 大 时 ， 我 们 把 时 间 复 杂 度 TO 的 数量 级 〈 阶 ) 称 为 算法 的 渐 
近 时 间 复 杂 度 (Asymptotic Time Complexity)。 例 如 ， 上 述 和 矩阵 乘法 的 时 间 复 杂 度 TO) 当 m 
趋 加 无穷大 时 ， 显 然 有 

lim TO)mm” = lim Qn +3n”* +2n+1)/n” =2 (12) 


这 表明 , 当 n 充分 大 时 , TD 和 nm 之 比 是 一 个 不 等 于 零 的 常数 , 即 Tn) 和 是 同 阶 的 ， 


(WD 从 C/C++ 语法 上 看 ， 单 独 的 for 并 不 是 “语句 ”， 它 与 后 面 的 循环 体 一 起 才 构 成 “循环 语句 ”。 孝 
想象 把 其 执行 过 程 拆 开 : 赋 初 值 1 次 〈F0)， 条 件 判断 n+l 次 〈i<n)， 循 环 变量 变化 mn 次 C++)， 则 该 部 
分 频 度 为 2n+t2， 但 最 终 复 杂 性 的 量 级 不 变 。 显 然 这 种 太 细节 化 的 处 理 既 烦琐 也 不 利于 突出 算法 本 身 的 主 
体 。 这 里 取 n+l 相当 于 只 考虑 其 中 频 度 最 大 的 部 分 ， 或 者 从 其 实际 作用 看 ， 把 for 当做 一 个 “循环 控制 语 
句 ”， 其 控制 ( 即 条件 判 断 ) 了 n+l 次 。 


或 者 说 TD) 和 mm 的 数量 级 相同 ， 记 作 Tm)=O(n)， 其 中 大 写字 母 O 表示 Order， 即 数量 级 。 
可 见 ， 上 述 和 矩阵 乘法 的 渐 近 时 间 复 杂 度 为 O0m )。 关 于 大 “0O” 记 号 ， 其 数学 定义 是 : 

设 TD) 和 fn) 是 两 个 非 负 函数 ,如 果 人 存在 正音 数 c 和 mno, 使 得 当 n=no 时 者 有 Tcfon) 
成 立 ， 则 Tn)=O(f(n))。 

根据 极限 定义 知 ，fo) 是 Tn) 的 一 个 上 界 函 数 〈 当 nn 足够 大 时 )。 一 般 而 言 ，T(0) 的 上 
界 函 数 可 能 很 多 ， 但 我 们 一 般 取 一 个 形式 舍 单 且 较 接近 的 上 界 。 比 如 2n+3=O(n)， 显 然 也 
有 2n+3=O 人 2)， 甚 至 2n+3=O(2 )， 但 只 有 最 接近 的 O(n) 才 更 有 意义 。 另 外 ， 渐 近 分 析 中 一 
般 忽 略 数量 级 中 的 系数 ， 既 可 简化 分 析 又 可 突出 重点 。 

类 似 ， 也 可 以 定义 算法 的 下 界 函 数 g(n)， 并 用 大 “Q” 表 示 为 T(n)=Q(g(n))。 同 样 ， 下 
界 函 数 也 可 能 很 多 ， 一 般 也 取 一 个 形式 简单 且 较 接近 的 下 界 。 当 上 、 下 界 相 等 时 ， 还 可 用 
大 “9” 表 示 ， 如 T(n)=O0hm)) 且 Tn)=Qh(n)) 时 ， 则 T(n)=eB(h(n))。 但 本 书 并 没有 这 样 严 
格 区 分 ， 一 则 为 了 简便 ， 二 则 很 多 算法 的 上 、 下 界 相等 ， 三 种 表示 法 是 一 致 的 。 

采用 渐 近 复杂 上 度 表 示 可 突出 算法 的 本 质问 题 ， 并 可 忽略 一 些 语句 书写 细节 上 的 差异 。 
如 “x=y; y=z;:” 和 “x=atb; y=c+x;” 分 别 是 2 条 语句 , 但 写成 “x=y, y=z:;” 和 “y=c+(x=at+b):” 
则 分 别 是 1 条 语句 。 显 然 这 些 细 节 差 寞 或 变形 并 不 影响 复 洒 度 的 量 级 。 

由 式 1.2 可 见 ， 渐 近 时 间 复 杂 度 实际 上 由 频 度 最 大 的 语句 (高 次 项 ) 决定 ， 故 在 具体 
分 析 时 ， 可 作 如 下 处 理 : 

(1) 硅 语 句 很 少 执行 ， 且 与 规模 无 和 天， 则 可 忽略 不 计 。 

(2) 硅 所 有 语句 都 与 规模 无 关 ， 即 使 有 上 干 条 语句 ， 其 执行 时 间 也 不 过 是 一 个 较 大 的 
常数 ， 时 间 复 杂 度 也 只 是 O(n )=0(1)。 

(3) 一 般 可 只 考虑 与 程序 规模 有 关 的 频 度 最 大 的 语句 ， 如 循环 语句 的 循环 体 ， 多 重 循 
环 的 内 循环 等 。 

例 1.5 交换 a 和 b 的 内 容 。 

解 : 

tmp=a; 

a=b; 

b=tmp; 

以 上 三 条 语句 的 频 度 都 为 1， 与 规模 nn 无关， 立即 可 知 T(n)=0O(1)。 

例 1.6 求 n 以 内 所 有 2 的 寡 次 数 之 和 ， 即 1+21+2?…+25，25<n。 

解 : 

sum=0; 

for (1=1;1<=n? 1*=2) 


这 里 循环 体 的 执行 次 数 未知 , 但 显然 不 是 n 次 , 设 为 k 次 ,由 于 <n, 所 以 k=O(og,n)， 
从 而 T(n)= O(log, n)。 

例 1.7 将 二 维 数 组 A[n][n] 的 内 容 清空 。 

解 : 

for (1=0;1<n;1++) 


for (]=07]J<nz]++) 
A[1] [Jj]=0; 
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显然 ， 频 上 度 最 大 的 语句 是 内 循环 体 AIilD]j=0， 而 内 循环 和 外 循环 各 执行 na 次， 即 该 语 
句 共 执行 了 nxn 次 ， 所 以 TOD=O”)。 

例 1.8 将 二 维 数组 Arn][m] 的 下 三 角 部 分 清空 。 

解 : 

for (1=0;1<n;1++) 

for (j=0;j<=i;j++) 
A[i] [j]=0; 

这 里 频 度 最 大 的 语句 仍然 是 内 循环 体 AlilfijF0， 其 中 外 循环 执行 了 na 次 ， 内 循环 执行 
了 1t1 次 ， 但 该 语句 总 的 频 度 不 能 简单 地 算 成 nx(Gi+l)， 因 为 1 不 是 常量 ， 应 该 按 循 环 从 内 
回 外 累加 出 来 : py +1)=1+2+3+…+n=n(n+1)/2， 所 以 Tn)=0O(n”)。 

有 些 算法 是 用 递归 方法 摘 述 的 ， 相 应 地 ， 时 间 复 杂 度 一 般 可 用 递归 方程 表示 ， 对 该 方 
程 求解 就 可 得 到 复杂 上 度 的 具体 表达 式 ， 本 书 在 树 、 排 序 等 章节 中 就 有 这 方面 的 例子 。 

在 实际 算法 分 析 时 ， 还 币 第 根据 问题 的 特点 ， 选 择 一 种 或 几 种 关键 操作 ， 如 数 什 计算 
问题 中 的 乘法 和 除法 、 查 找 问 题 中 的 比较 、 排序 问题 中 的 比较 和 移动 等 , 作为 “标准 操作 ”， 
来 考察 标准 操作 的 时 间 复 杂 度 。 由 于 各 种 操作 都 有 对 应 的 语句 ， 这 相当 于 考察 特定 语句 的 
频 度 或 时 间 复 杂 度 ， 分 析 方 法 是 相同 的 。 

将 常见 的 渐 近 复 洒 上 度 ， 按 数量 级 递增 排列 ， 依 次 为 :常数 阶 O(1)、 对 数 阶 O(logzn)、 
线性 阶 O(n)、 线 性 对 数 阶 Onlog, n) 、 平 方 阶 OY)、 立 方 阶 0G))、…、 次 方 阶 0(0)、 
指数 阶 O(2 )， 另外 还 有 复杂 度 更 高 的 阶乘 阶 On!) 和 n 次 方 阶 O(n 等 。 其 中 , 后 三 种 常 统 
称 为 指数 复杂 性 ， 其 他 则 统称 为 多 项 式 复杂 性 。 图 1.4 展示 了 几 种 复杂 度 的 增长 率 。 
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图 1.4 几 种 常见 复杂 度 的 增长 趋势 


很 多 算法 的 时 间 复 杂 度 不 仅 与 问题 的 规模 有 关 ， 还 与 所 处 理 的 数据 集 的 状态 有 关 。 这 
是 因为 有 些 语句 的 频 度 对 算法 本 喘 而 言 是 不 确定 的 ， 要 取决 于 具体 的 数据 情况 。 通 常 ， 这 
类 算法 在 程序 上 的 一 个 特点 是 用 if-…else 或 switch 语句 来 处 理 不 同 的 情况 。 对 这 类 问题 ， 
原则 上 需 用 概率 论 的 方法 来 解决 ， 但 一 般 是 根据 数据 集中 可 能 出 现 的 最 坏 或 最 好 情况 ， 估 
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计 出 算法 的 最 坏 (Worst) 时 间 复 杂 度 或 最 好 (Best) 时 间 复 杂 度 ; 或 者 对 数据 集 的 分 布 作 
出 茶 种 假定 〈 如 等 概率 )， 讨 论 算法 的 平均 (Average) 时 间 复 杂 度 。 

例 1.9 在 数组 A[n] 中 查找 值 为 K 的 元 素 。 

解 : 

for (1=0;1<n;1++) 

if (A[i]==K) break; 

这 里 ， 比 较 语句 的 执行 次 数 不 仪 与 问题 的 规模 n 有 关 ， 还 与 数组 A 中 各 元 素 的 取 值 状 
态 有 关 。 最 好 时 ， 所 要 俘 找 的 元 素 是 数组 的 第 一 个 元 素 ， 只 比较 1 次 ; 最 坏 时 ， 上 所 要 得 找 
的 元 素 是 数组 的 最 后 一 个 元 素 ， 要 比较 n 次 。 如 果 所 要 查找 的 元 素 出 现在 数组 中 各 位 置 的 
概率 是 相等 的 ， 则 不 难 知道 ， 得 找 成 功 时 平均 比较 (n+1)/2 次 。 

与 算法 分 析 类 似 ， 还 可 以 进行 “问题 ”分 析 。 即 对 问题 所 有 可 能 的 得 法 ， 包 括 尚 未 
发 现 的 算法 ， 分 析 它 们 效率 的 总 体 上 下 限 。 在 本 书 排序 一 章 会 提 到 这 个 问题 。 


1.3.3 ”空间 复杂 度 


一 个 算法 所 耗费 的 空间 ， 应 该 是 算法 运行 所 需 的 各 种 存储 空间 的 总 和 ， 其 中 包括 代码 
和 数据 两 部 分 ， 但 数据 结构 所 讨论 的 空间 复杂 上 度 是 指数 据 部 分 的 空间 耗费 〈 包 括 函 数 调用 
所 需 的 栈 空 间 )。 根 据 是 否 与 问题 的 输入 有 关 ， 这 部 分 空间 又 可 分 为 固定 部 分 和 可 变 部 分 。 
前 者 与 输入 数据 的 状态 和 规模 无 关 ， 如 程序 币 量 和 辅助 工作 变量 等 ， 后 者 则 直接 相关 。 当 
问题 的 规模 较 大 时 ， 可 变 部 分 会 远大 于 固定 部 分 ， 押 以 数据 结构 中 一 般 讨 论 问 题 的 渐 近 衬 
间 复 杂 上 度 ， 也 和 便 称 空间 复杂 上 度 ， 分 析 方 法 与 时 间 复 杂 上 度 类 似 ， 这 里 就 不 多 述 了 。 


1.3.4 ”时空 复 杂 度 的 意义 


(1) 时 间 复 杂 度 可 用 于 比较 不 同 算法 时 间 性 能 的 相对 好 坏 。 例 如 ， 设 有 算法 1 和 算法 
2 求解 同一 个 问题 ， 它 们 的 时 间 复 杂 度 分 别 是 Ti(n)=100n*=O(n”)，T2(n)=5m3=O(m)。 它 们 
的 时 间 开 销 之 比 100n”/5n =20m， 当 规模 较 小 时 ， 如 n<20， 有 Ti(n)>Ts(n)， 后 者 花费 的 时 
间 较 少 。 但 是 ， 随 着 问题 规模 的 增 大 ， 算 法 2 的 时 间 耗 费 就 会 超过 算法 1， 并 且 其 差距 还 
会 继续 加 大 ， 此 时 算法 1 要 有 效 得 多 。 

实际 上 ， 在 评价 一 个 算法 的 时 间 性 能 时 ， 一 般 采 用 渐 近 时 间 复 杂 度 。 另 外 ， 人 往往 对 算 
法 的 时 间 复 杂 度 和 渐 近 时 间 复 杂 度 不 予 区 分 ， 经 稼 将 渐 近 时 间 复 杂 度 简称 为 时 间 复 杂 度 。 

从 图 1.4 可 以 看 到 ，0O(n) 与 O(nlog, nn) 的 增长 比较 平缓 ， 所 以 实际 应 用 中 O(n) 与 
O(nlog, n) 的 算法 差别 可 能 并 不 很 大 ， 但 O(nlog, n) 和 O(n ) 的 算法 差别 就 非常 大 了 。 

(2) 时 间 复 杂 度 可 从 宏观 上 评价 算法 的 时 间 性 能 。 例如， 指数 阶 0(2 ) 的 复杂 度 增长 太 
快 , 当 n 稍 大 时 效率 极 低 , 无 法 应 用 , 即 这 类 算法 是 不 可 行 的。 假设 计算 机 每 秒 执行 1000G 
条 指令 目前 微机 为 3G 左右)， 则 当 n=100 时 ， 执 行 2 条 指令 需 耗 时 : 

2” /000x10”) 


T= 二 一 -4x10" 年 〈 即 约 400 亿 年 !) 
365x24x3600 Ls I 
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不 难 理解 ， 如 果 能 将 现 有 指数 时 间 算 法 中 的 任何 一 个 化 简 为 多 项 式 时 间 算 法 ， 将 是 一 
个 伟大 的 成 就 。 

(3) 时 间 复 杂 度 可 粗略 估计 同一 个 算法 的 时 间 变 化 趋势 。 如 高 斯 消 元 法 解 线性 方程 组 
的 时 间 复 杂 度 为 Oo3) ， 即 求解 时 间 随 问题 规模 呈 立 方 增长 ， 如 果 阶 数 增加 一 倍 ， 求 解 时 
间 大 约 将 是 原来 的 2 =8 倍 。 于 是 , 假设 在 某 机 器 上 解 100 阶 的 线性 方程 组 用 了 5 分 钟 ， 则 
解 200 阶 的 线性 方程 组 将 大 概 用 5x8=40 分 钟 ! 

(4) 平均 时 间 复 杂 度 反映 的 是 总 体 性 能 ， 比 较 符 合 实际 使 用 情况 ， 最 好 时 间 复 杂 度 反 
映 的 是 理想 情况 ， 最 坏 时 间 复 杂 度 反映 的 是 最 坏 会 怎么 样 ， 它 们 发 生 的 概率 一 般 都 较 小 。 
在 后 两 者 中 ， 一 般 较 关心 最 坏 时 间 复 杂 度 ， 因 为 它 太 差 的 话 ， 即 使 发 生 的 概率 小 之 又 小 ， 
则 给 人 的 感觉 就 是 不 可 靠 ， 这 时 即便 最 好 或 平均 情况 再 好 ， 人 们 也 难以 采用 。 

($5) 对 实际 问题 ， 一 般 时 间 复 共度 显得 比 空间 复杂 上 度 重 要 些 。 这 主要 是 因为 实际 问题 
的 规模 一 般 较 大 ， 计 算 时 间 较 长 ， 常 常 是 应 用 中 的 一 个 突出 问题 。 也 许 采 用 更 快 的 计算 机 
(比如 不 久 后 计算 机 技术 发 展 了 , 或 直接 采用 当前 更 高 速 的 计算 机 等 ) 可 以 解决 原来 时 间 复 
杂 度 大 的 问题 , 但 拥有 更 好 的 计算 条 件 后 ， 人 们 往往 又 希望 求解 更 大 规模 或 更 复杂 的 问题 ， 
其 结果 是 计算 机 速度 的 提高 总 是 难以 满足 实际 问题 ， 特 别 是 大 规模 复杂 问题 的 要 求 。 

比如 , 大 多 数 问题 的 时 间 复 杂 度 都 高 于 O(n), 常见 的 是 O(nlog, n)、0O(n ) 、0O(n ) 等 ， 
以 一 般 线 性 方程 组 求解 的 时 间 复 杂 度 O(n ) 为 例 ， 假 设计 算 机 速度 提高 到 了 原来 的 10 倍 ， 
则 相同 时 间 内 可 求解 的 问题 规模 大 约 只 能 提高 到 原来 的 六 0 = 2.15 倍 。 并 且 不 难看 到 ， 时 
间 复 杂 度 越 高 的 算法 从 提高 机 器 速度 得 到 的 收益 相对 就 越 小 。 所 以 追求 高 速算 法 总 是 一 件 
重要 事情 。 相 比 起 来 ， 空 间 复杂 上 度 问 题 就 没有 时 间 复 杂 度 那样 严重 ， 但 这 并 不 是 因为 计算 
机 的 存储 衬 间 是 海量 的 ， 而 是 由 实际 问题 的 本 质 决 定 的 。 

(6) 时 间 复 杂 度 与 空间 复杂 度 往往 是 一 对 矛盾 ， 常常 可 以 用 空间 换取 速度 ， 反 之 亦 然 。 
也 就 是 说 ， 为 了 获得 较 快 的 速度 ， 一 般 要 花费 较 多 的 空间 ;为 了 使 用 较 少 的 空间 ， 一 般 要 
人 花费 较 多 的 时 间 。 这 方面 的 例子 在 数据 结构 的 一 些 算法 中 屡见不鲜 。 但 应 指出 : 

GD 时 间 和 空间 的 这 种 彼 消 此 长 的 作用 ， 一 般 只 是 在 原 有 基础 上 某 个 倍数 或 比率 的 变 
化 ， 并 不 能 改变 算法 本 身 复 杂 度 的 量 级 ， 比 如 ， 腺 复杂 度 为 O(am)， 新 复杂 度 为 O(Bn)， 只 
是 其 中 的 系数 不 同 而 已 。 

@) 这 个 结果 是 对 内 存 而 言 的 ， 如 果 是 外 存 ， 情 况 可 能 正好 相反 ， 因 为 外 存 速 度 一 般 
比 内 存 和 CPU 速度 慢 几 个 数量 级 ， 外 存 用 得 越 大 ， 数 据 输入 和 输出 所 花费 的 时 间 就 越 大 ， 
整个 处 理 时 间 一 般 会 越 大 ， 而 不 是 越 小 。 

(7) 有 助 于 正确 认识 和 运用 代码 调整 与 优化 。 有 了 时 对 代码 进行 调整 (Code Tuning) 可 
使 程序 的 执行 时 间 大 为 缩短 (如 减少 到 原来 的 1/10)， 或 者 降低 存储 需求 (如 降 到 原来 的 
1/2)， 但 这 也 不 能 改变 算法 复杂 上 度 的 量 级 ， 因 为 算法 的 复杂 上 度 是 由 算法 本 身 决 定 的 。 代 人 码 
调整 也 不 能 代 蔡 算法 分 析 的 作用 。 事 实 上 ， 只 有 在 算法 分 析 的 基础 上 才 知 道 哪些 地 方 是 调 
整 的 关键 ， 即 那些 频 度 最 大 或 空间 需求 最 大 的 语句 ， 反 之 ， 对 那些 只 占 总 执行 次 数 很 少 比 
率 的 语句 进行 调整 是 没有 意义 的 。 另 外 ， 调 整 也 不 应 牺牲 算法 或 程序 的 可 谈 性 。 一 个 较 好 
的 方法 是 利用 编译 器 进行 代码 优化 ， 不 过 它 只 对 表达 式 、 循 环 、 跳 转 等 优化 比较 有 效 ， 而 
对 算法 本 身 作 用 不 大 ， 因 为 编译 器 不 可 能 改变 算法 。 
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所 以 ， 要 获得 最 好 的 时 间 和 空间 复杂 度 ， 根 本 还 在 于 采用 更 好 的 数据 结构 和 算法 。 采 
用 高 速 计算 机 、 代 码 调整 或 优化 等 ， 只 能 作为 辅助 手段 。 


1.1 大 没有 计算 机 ， 是 否 束 没有 数据 结构 的 问题 ? 算法 是 人 奋 最 终 部 要 转换 为 计算 机 


程序 ? 
12 ”解释 数据 、 数 据 元 素 、 数 据 项 、 罗 辑 结构 、 存 储 结构 、 运 算 、 算 法 、 程 序 等 概念 
及 其 相互 关系 。 


1.3 数据 的 存储 结构 是 售 只 有 4 种 ? 

1.4 计算 机 的 速度 越 来 越 快 ,储存 量 也 越 来 越 大 ， 那 么 研究 算法 的 复 洒 度 有 何 意义? 
1.5 按 数 量 级 从 小 到 大 的 顺序 排列 下 列 函 数 : 

2%, (312) (2/3)°, nn, nn nl 2”, logn, nlog,n 

1.6 判断 下 列 程序 段 的 复杂 度 : 

(1) 

1=1; 

while (i*1<=n) 1++; 


(2) 
S=0 7; 
for (1=1;1<=n;1++) 
for (J]=i*i;]<=n;]++) 
S=s+1; 
1.7 编写 算法 实现 以 下 功能 ， 并 分 析 其 时 间 复 杂 度 : 
(1) 求 n 以 内 所 有 整数 之 和 ， 即 1+2+…+n。 
(2) 求 n 以 内 所 有 奇数 之 和 ， 即 1+3+…+(2k-1)，2k-1 太 n。 
(3) 将 n 以 内 整数 依次 相 加 ， 但 最 多 加 到 和 为 n， 即 1+2+3+…<n。 
1.8 ”编写 算法 ， 将 二 维 数 组 A[1..n][1..n] 中 第 1, 2, 4, 8，… 行 对 角 元 之 六 的 元 素 清空 。 
分 析 其 时 间 复 杂 度 。 
1.9 ”对 下 列 程序 段 进行 代码 调整 以 改善 其 性 能 : 


min=A[0]; 
for (1i=1;1i<n;1i++) 
if (A[i]<min) min=A[i]; 
max=A[0]; 
for (i=1;1i<n;1++) 
if (A[i]>max) max=A[i]; 


1.10 ”能 人 否 不 用 中 间 量 〈 附 加 空间 ) 交换 两 个 变量 的 内 容 ? 


人 


”线性 表 


线性 表 是 最 简单 、 最 常见 的 一 种 数据 结构 。 本 章 将 详细 介绍 线性 表 的 基本 概念 、 线 性 
表 的 两 种 主要 存储 结构 一 一 顺序 表 和 和 链表、 线性 表 的 一 些 常 见 运算 及 其 在 这 两 种 存储 结构 
上 的 实现 。 线 性 表 的 有 关 知 识 也 有 助 于 下 一 重 将 要 讨论 的 栈 、 队 列 、 串 等 数据 结构 。 


声 线性 表 的 基本 概念 


线性 表 是 将 一 批 数 据 元 素 一 个 接 一 个 地 依次 排列 得 到 的 一 种 结构 ， 这 方面 的 例子 不 胜 
枚 举 。 例 如 ， 英 文字 母 表 (A, B, C，…, Z) 束 是 一 个 线性 表 ， 表 中 的 每 一 个 英文 字母 是 一 个 
数据 元 素 ， 又 如 ， 一 副 扑 克 牌 的 点 数 表 (2, 3, 4, 5, 6, 7, 8, 9, 10, J Q, K, A) 也 是 一 个 线性 表 ， 
其 中 每 一 张 牌 的 点 数 是 一 个 数据 元 素 。 在 较为 复杂 的 线性 表 中 ， 数 据 元 素 可 由 右 干 数据 项 
组 成 ， 如 学 生成 绩 表 ， 每 个 学 生 的 所 有 信息 组 成 一 个 数据 元 素 ， 它 由 学 号 、 姓 名 、 班 级 、 
各 科 成 绩 等 数据 项 组 成 。 综 合 类 似 例子 ， 可 以 将 线性 表 一 般 地 描述 为 : 

线性 表 (Linear List) 是 由 n (Cn=0) 个 数据 元 素 ( 结 点 ) ai, aa，…, an 组 成 的 有 限 序 列 。 
其 中 ， 数 据 元 素 的 个 数 n 定义 为 表 的 长 度 。 当 n=0 时 称 为 空 表 ， 记 作 ( ) 或 @， 若 线性 表 的 
名 字 为 L， 则 非 空 的 线性 表 (n>0) 记 作 : 

L= (al, a, ***， an) 

这 里 数据 元 素 ai:(1<i<n) 只 是 一 个 抽象 的 符号 ， 其 具体 含义 在 不 同情 况 下 可 以 不 同 ， 
但 同一 个 线性 表 的 数据 元 素 类 型 一 般 要求 相 同 ， 这 称 为 同 构 (Homogeneity )。 

线性 表 的 相 令 元素 之 间 存 在 看 前 后 顺序 关系， 其 中 第 一 个 元 素 无 前 趋 ， 最 后 一 个 元 素 
无 后 继 ， 其 他 每 个 元 素 有 且 仅 有 一 个 直接 前 趋 和 一 个 直接 后 继 。 可 见 ， 线 性 表 是 一 种 线性 
结构 。 

设 工 代表 某 线性 表 ， 对 线性 表 的 基本 运算 ， 常见 的 有 以 下 几 种 。 

(1) 初始 化 INITIATE(L): 加 工 型 运算 ， 作 用 是 建立 一 个 空 表 L= 名 。 执 行 该 操作 后 ， 
线性 表 的 其 他 操作 才能 进行 。 

(2) 求 表 长 LENGTH(L): 引用 型 运算 ， 结 果 是 线性 表 工 中 的 结 点 个 数 。 

(3) 读 表 元 〈 按 序号 查找 ) GET(L, 了): 引用 型 运算 ， 大 1<i<LENGTH(L) 时 ， 结 果 是 
表 工 中 的 第 i 个 (序号 为 i 结 点 〈 值 或 地 址 )， 否 则 ， 结 果 为 一 个 特殊 值 。 

(4) 定位 〈 按 值 人 查找) LOCATE(L, x): 引用 型 运算 ， 当 线性 表 工 中 存在 一 个 或 多 个 值 
为 x 的 结 点 时 ,结果 是 这 些 结 点 中 首次 找到 的 结 点 (序号 或 地 址 ); 否则 ,结果 为 一 个 特殊 
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值 (如 零 )。 

(5) 插入 INSERT(L, x, D: 加 工 型 运算 ， 在 线性 表 工 的 第 1 个 位 置 插入 一 个 值 为 x 的 
新 结 点 ， 使 得 原 表 由 (a1，…, ai1, ai，…, an) 变 为 (31，…, ai X, ai，…, an)。 这 里 1<i<nt+l， 
而 n 是 原 表 的 长 度 。 插 入 后 元 素 个 数 增 1， 原 第 i 个 元 素 之 后 的 元 素 的 序号 也 分 别 增 1。 

06) 删除 DELETE(L D: 加 工 型 运算 , 删除 线性 表 工 的 第 i 个 结 点 , 使 得 原 表 由 (a1，… 
ai ai aitl;,， …, an) 变 为 (3a1，…, ai aitl …, an)。 这 里 1<i<n， 而 n 是 原 表 的 长 度 。 删 除 后 
元 素 个 数 减 1， 原 第 1 个 元 素 之 后 的 元 素 的 序号 也 分 别 减 1。 

线性 表 的 其 他 运算 可 用 这 6 种 基本 运算 来 实现 ， 如 修改 第 i 个 元 素 的 值 SET(L., i, Xx)、 
求 某 个 元 素 的 前 趋 PRIOR(L, x) 和 后 继 NEXT(L, x)、 判 断 线 性 表 是 否 为 定 EMPTY(L)、 线 
性 表 的 合并 MERGE(L, L1, L2) 和 拆 分 SPLIT(L, i, L1,L2) 等 .另外 ,排序 也 可 看 成 基本 运算 ， 
但 由 于 其 特殊 性 我 们 在 第 7 章 单独 讨论 。 注 意 , 实际 问题 并 不 一 定 需要 同时 执行 以 上 运算 ， 
要 根据 情况 进行 选择 。 

由 于 数据 的 运算 是 定义 在 逻辑 结构 上 的 ， 而 运算 的 具体 实现 则 是 在 存储 结构 上 进行 
的 , 所 以 , 线性 表 的 上 述 运 算 , 只 是 在 逻辑 结构 上 给 出 了 运算 的 功能 是 “做 什么 ”至 于 “如 
何 做 ”等 实现 细节 ， 只 有 确定 了 存储 结构 之 后 才能 考虑 。 


22 线性 表 的 顺序 实现 


在 本 书 中 ， 一 种 数据 结构 的 顺序 实现 是 指 按 顺序 存储 方式 构建 其 存储 结构 ， 并 在 此 存 
储 结构 上 实现 其 基本 运算 。 


2.2.1 顺序 表 


将 一 个 线性 表 存 储 到 计算 机 中 ， 可 以 采用 许多 不 同 的 方法 ， 其 中 既 简单 又 自然 的 是 顺 
序 存 储 方法 ， 即 把 线性 表 的 结 点 按 效 辑 次 序 依次 存放 到 一 组 地 址 连续 的 存储 单元 里 ， 用 这 
种 方法 存储 的 线性 表 简称 为 顺序 表 (Sequential List”)。 

假设 顺序 表 中 每 个 结 点 占用 c 个 存储 单元 ， 其 中 第 一 个 结 点 a 的 存储 地 址 (以 下 简称 
基地 址 ) 是 Loc(1)， 则 结 点 ai 的 存储 地 址 LocG) 可 通过 下 式 计 算 : 

Loc()=Loc(])+(I 一 1] )xc l<1i<n 

也 就 是 说 , 在 顺序 表 中 , 每 个 结 点 ai 的 存储 地 址 是 该 结 点 在 表 中 的 位 置 i 的 线性 函数 ， 
只 要 知道 基地 址 和 每 个 结 点 的 大 小 ， 就 可 在 相同 的 (好 辑 ) 时 间 内 求 出 任 一 结 点 的 存储 地 
址 。 因 此 顺序 表 是 一 种 随机 存 取 结构 。 

在 程序 设计 语言 中 ， 一 维 数组 (本 书 也 称 向 量 ) 一 般 都 是 用 顺序 存储 表示 的 ， 故 可 用 
一 维 数组 来 摘 述 顺序 表 。 但 数组 定义 后 其 大 小 一 般 不 能 再 改变 ， 而 线性 表 的 表 长 是 可 变 的 
(如 插入 和 删除 时 )， 所 以 要 将 数组 预 设 足够 的 大 小 (容量 ); 同时 还 需要 一 个 变量 指出 线性 
表 在 数组 中 的 当前 状况 ， 如 元 素 的 个 数 或 最 后 一 个 元 素 在 数组 中 的 位 置 等 。 这 两 方面 的 信 


Q) 有 的 文献 用 Sequential List 表示 线性 表 ， 用 Contiguous List 表示 顺序 表 。 
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县 共同 摘 述 一 个 顺序 表 ， 可 将 它们 封装 在 一 起 。 
对 C/C++ 语言 ， 顺 序 表 可 定义 如 下 : 
typedef int datatype; // 线 性 表 结 点 的 数据 类 型 ， 假 设 为 int 
const int maxsize=100; // 线 性 表 可 能 的 最 大 长 度 ， 这 里 假设 为 100 


typedef struct { 
datatype data[maxsize];  // 线 性 表 的 存储 问 量 ， 第 一 个 结 点 是 data[0] 


int n; // 线 性 表 的 当前 长 度 

} sqlist; / /顺序 表 类 型 

其 中 ， 

(1) 数据 域 data 是 存放 线性 表 各 结 点 的 数组 空间 ， 下 标 范 围 是 0 一 maxsize-1， 线 性 表 
的 结 点 ai 存放 在 数组 元 素 datali-1] 中 。 显 然 线 性 表 结 点 的 个 数 不 能 超过 数组 空间 的 大 小 
maxslze。 

(2) 数据 域 n 记录 线性 表 当 前 的 长 度 ， 终 冰 结 点 的 数组 下 标 为 n-1。 


(3) datatype 是 线性 表 结 点 的 类 型 ， 它 应 是 某 种 定义 过 的 类 型 ， 具 体 含义 要 视 实际 情 
况 而 定 。 例 如 ， 若 线性 表 是 英文 字母 表 ， 则 datatype 就 是 字符 类 型 char， 若 线性 表 是 学 生 
成 绩 表 ， 则 datatype 就 是 已 定义 过 的 表示 学 生 情 况 的 结构 类 型 。 

(4) 顺序 表 类 型 sqlist 是 一 个 结构 类 型 ， 它 将 
顺序 表 的 有 关 信息 封装 在 一 起 作为 一 个 整体 看 待 ， ,se mane 
符合 结构 程序 设计 的 思想 。 这 样 每 个 顺序 表 只 用 一 
个 名 字 就 可 以 表示 ， 但 当 要 访问 顺序 表 的 细节 时 ， 
需要 使 用 成 员 选 择 运算 符 或 指针 指向 运算 符 。 例如 pe a wil 
设 工 是 sqlist 类 型 的 变量 ， 则 顺序 表 工 的 第 一 个 结 : : 


点 是 L.data[0]， 终端 结 点 是 L.data[n-1]。 这 便于 管 b+c 1 
理 程序 中 有 多 个 顺序 表 的 情况 。 如果 程序 中 只 有 个 . 
别 顺序 表 ， 为 了 书写 简便 ,也 可 不 用 结构 而 分 别 由 
一 个 癌 量 和 一 个 整 型 变量 来 表示 它 。 图 2.1 为 顺序 图 2.1 顺序 表示 意图 
表 的 示意 图 ， 其 中 上 b 为 第 一 个 元 素 的 存储 地 址 。 

总 之 ， 顺 序 表 是 用 癌 量 实现 的 线性 表 ， 癌 量 下 标 可 看 成 结 点 的 相对 地 址 。 它 的 特点 是 
逻辑 上 相 邻 的 结 点 其 物理 位 置 亦 相 邻 。 

顺便 指出 ， 顺 序 表 实现 时 也 可 从 数组 下 标 1 开始 使 用 ， 这 时 结 点 ai 存放 在 数组 元 素 


data[i] 中 ， 数 组 大 小 为 data[maxsize+1]。0 号 单元 不 用 ， 但 也 可 用 来 存放 线性 表 长 度 〈 这 时 
可 省 略 顺序 表 的 长 度 域 n)。 


2.2.2 顺序 表 上 的 基本 运算 


定义 了 线性 表 的 存储 结构 之 后 ， 就 可 以 讨论 在 该 存储 结构 上 如 何 实现 原来 定义 在 逻辑 
结构 上 的 运算 了 。 在 顺序 表 中 , 线性 表 的 有 些 运 算 很 容易 实现 。 例 如， 初始 化 INITIATE(L) 
就 是 将 Ln 置 为 0;， 取 第 i 个 结 点 GET(L, i) 即 取出 L.datafi-1]; 求 表 长 LENGTH(L) 即 取出 
Ln 和 等， 它们 的 时 间 复 杂 度 为 O0(1)。 以 下 仅 讨 论 插入 、 删 除 和 定位 等 运算 。 
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1. 插入 

线性 表 的 插入 运算 是 指 在 表 的 第 i (1<i<n+1) 个 位 置 上 , 插入 一 个 新 结 点 x， 使 长 度 
为 n 的 线性 表 (a1，…, ai1, ai ……, an) 变 为 长 度 为 ntl 的 线性 表 (ai，…, ai X, ai,，…, an)。 

用 顺序 表 作 为 线性 表 的 存储 结构 时 ， 由 于 结 点 的 物理 顺序 必须 和 结 点 的 逻辑 顺序 保持 
一 致 ， 因 此 在 插入 时 ， 要 先 将 表 中 位 置 i~na 上 的 结 点 全 部 后 移 一 位 以 空 出 第 i 个 位 置 ， 然 
后 在 该 位 置 上 插入 新 结 点 x， 最 后 表 长 加 1。 特 别 地 ， 插 入 位 置 =n+l 时 无 须 移动 结 点 ， 直 
接 将 x 插入 到 表 的 末尾 即 可 。 插 入 过 程 见 图 2.2。 

注意 ， 结 点 移动 的 次 序 只 能 从 后 癌 前 进行 ， 即 按 n, n-1,…, i 的 次 序 进行 移动 ， 否 则 ， 
若 从 前 向 后 移动 , 则 后 面 元 素 的 数据 将 被 前 面 的 冲 掉 ， 结果 插入 点 所 后 的 数据 将 全 部 都 是 ai。 

空 亲 


i 
I~2 iI-1 i maxsize—1 


插入 前 Tl [all 
NANN 人 
吉 者 | 需 一 一 人 一 一 


0 1 和 n-1 n maxsize—1 
后 移 | ai| a a | a | 
空闲 
一 -人 一 一 
一世 下 1 n-—1 n maxsize—1 
插入 后 区 证 E 记 


图 2.2 顺序 表 中 插入 结 点 过 程 示意 图 
顺序 表 插 入 的 具体 算法 如 下 其 中 通过 函数 的 返回 值 区 分 插入 的 执行 情况 ): 


int insert (sqlist *L,datatype x,int i) {// 将 x 插入 到 顺序 表 工 的 第 i 个 位 置 上 


EE 了 
if (IL->n==maxsize) {cout<<”“ 表 满 ， 不 能 插入 ! (上 洲 ) \n”;return -17} 
if(i<1l1 || i>L->n+1) {cout<<”“ 非 法 插入 位 置 !\n”; return 0;} 
for (J=L->n;]>=i;]—-) 
-datalil rT Sdatald ls // 结 点 后 移 
L->data[i-1]=x; // 插 入 x， 第 个 结 点 的 数组 下 标 是 i-1 
L—->n++; / /修改 表 长 
yetwrn 1 // 插 入 成 功 


} 


注意 函数 参数 表 中 , 对 应 顺序 表 的 参数 是 其 指针 (〈 传 地 址 ) 而 不 是 顺序 表 本 吴 〈 传 值 )， 
是 考虑 到 顺序 表 的 内 容 较 大 ， 按 值 传递 比较 费时 《〈 实 参 内 容 要 复制 到 形 参 )。 对 此 也 可 采用 
C++ 的 引用 参数 传递 〈 略 ， 人 参见 附 录 B)。 

设 表 的 长 度 为 nD， 上 述 算法 的 时 间 主 要 花 在 for 循环 中 的 结 点 后 移 上 ， 该 语句 的 执行 次 
数 也 就 是 结 点 的 移动 次 数 ， 为 nr-i+1。 可 见 ， 结 点 的 移动 次 数 不 仅 与 表 的 长 度 n 有 关 ， 还 
与 插入 位 置 1 有关。 当 1=n+1 时 ， 结 点 移动 次 数 为 0; 当 二 1 时 ， 结 点 移动 次 数 为 n。 即 算 
法 的 最 好 时 间 复 杂 度 是 0(1)， 最 坏 时 间 复 杂 上 度 是 O(n)。 

下 和 面 考察 算法 的 平均 时 间 性 能 。 设 在 表 中 第 i 个 位 置 上 插入 一 个 结 点 的 概率 为 pb， 在 
第 1 个 位 置 上 插入 一 个 结 点 时 的 移动 次 数 为 tc， 则 结 点 的 平均 移动 次 数 为 M= >》pici ， 其 


1=1 
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中 cian-i+1， 但 p; 未 知 。 不 失 一 般 性 ， 假 设 在 表 中 任何 合法 位 置 (1<i<n+1) 上 插入 结 点 
的 机 会 是 均等 的 ， 则 p, =p, =…=p。w =1/(n+1)， 因 此 ， 在 等 概率 插入 的 情况 下 : 
en 
-sya 


也 就 是 说 ， 在 顺序 表 上 做 插入 运算 ， 平 均 要 移动 表 中 一 半 的 结 点 。 当 表 长 n 较 大 时 ， 
算法 的 效率 相当 低 。M 中 的 系数 较 小 ， 但 就 数量 级 而 言 ， 它 仍然 是 线性 阶 的 ， 因 此 算法 的 
平均 时 间 复 杂 度 是 O(n)。 


2. 删除 
线性 表 的 删除 运算 是 指 将 表 的 第 1 (1<i<n) 个 结 点 删 去 , 使 长 度 为 n 的 线性 表 (a1，… 


ai1, ai aitl，…, an) 变 为 长 度 为 n--1 的 线性 表 (ai，…, ai_i, aitl，…, an)。 
和 插入 算法 类 似 , 在 顺序 表 上 实现 删除 运算 也 必须 移动 结 点 : 先 将 表 中 位 置 1~n 上 
的 结 点 全 部 前 移 一 位 以 填补 删除 操作 造成 的 空缺 ， 然 后 表 长 减 1。 特 别 地 ， 删 除 位 置 i=n 


时 无 须 移 动 结 点 ， 直 接 删 除 终端 结 点 即 可 。 
注意 ,这 里 结 点 的 移动 次 序 只 能 从 前 向 后 进行 ， 即 按 计 1, i+2,…, n 的 次 序 进行 。 删 除 


过 程 见 图 2.3。 


空闲 
0 1 2 1 i n 一 1 maxsize—1 


删除 前 | at| az|… [ar aa lad|a| … | 


/空闲 
ps » Ls 一 人 ~ 
1 有 nn-2 maxsize—1 


az|… |ailahilakzl…… | al … | | 
图 2.3 顺序 表 中 删除 结 点 过 程 示意 图 


删除 过 程 的 具体 算法 如 下 : 
int delete(sqlist *L,int i) { // 从 顺序 表 中 删除 第 i 个 位 置 上 的 结 点 
1 
if (IL->n==0) {cout<<“ 表 空 ， 不 能 删除 ! (下 滋 ) \n”;return -1;} 
if(i<1 || i>L->n) {cout<<”“ 非 法 删除 位 置 !\n”; return 0;} 
for (J=1i+1;]<=L-—>n;]J++) 
-Saatal 21 Emitali Ll // 结 点 前 移 ， 第 j 个 结 点 的 数组 下 标 是 j-1 
Ti / /修改 表 长 
return 1; // 删 除 成 功 
} 


该 算法 的 时 间 分 析 与 插入 算法 类 似 ， 结 点 的 移动 次 数 也 是 由 表 长 n 和 位 置 1 决定 的 。 
删除 第 个 结 点 时 , 结 点 的 移动 次 数 为 c=n-i。 当 i=n 时 结 点 移动 次 数 最 少 , 为 0 次 ; 当 二 ] 
时 结 点 移动 次 数 最 多 ， 为 n-1 次 。 这 两 种 情况 下 算法 的 时 间 复 杂 度 分 别 是 0O(1) 和 O(n)。 

删除 算法 的 平均 性 能 分 析 也 与 插入 算法 相似 。 如 果 在 每 个 位 置 1 (1<i<n) 上 删除 结 
点 的 概率 相等 ， 则 p, =1/n 。 这 样 ， 在 等 概率 删除 的 情况 下 : 

nn 一 1 nl 
M= > pc = > 一 一 一 一 


1=1 1=1 2 


0 
删除 后 「 3 | 
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即 在 顺序 表 上 做 删除 运算 , 平均 要 移动 表 中 约 一 半 的 结 点 , 平均 时 间 复 杂 度 也 是 O(n)。 
3. 定位 
定位 运算 LOCATE(L, x) 的 功能 是 求 表 工 中 第 一 个 值 为 x 的 结 点 的 序号 , 当 不 存在 这 种 
结 点 时 结果 为 0。 因 此 可 从 前 问 后 比较 各 结 点 的 值 是 否 等 于 x。 算 法 如 下 : 
int locate(sqlist *L,datatype x) { 
了 和 让 和 
1=1; 


while (i<=L-—>n && L->data[i-1] !=x) i++; 
iF(1< LD Sn}) return 1 
else return 0; 


} 


其 中 while 循环 结束 时 有 两 种 情况 ， 一 是 找到 了 值 为 x 的 结 点 ， 此 时 1 为 有 效 结 点 号 ， 
1<=L->n; 一 是 表 中 没有 值 为 x 的 结 点 ， 此 时 循环 终止 于 二 L->n+1。 故 最 后 分 情况 返回 不 
同 结果 。 但 这 两 种 情况 也 可 用 取 模 运算 统一 起 来 : return 1%(L->n+1)。 

显然 ， 上述 算法 的 时 间 主 要 花 在 结 点 值 的 比较 上 , 易 知 比 较 次 数 最 少 1 次 , 最 多 n 次 ， 
平均 (n+1)/2 次 ， 所 以 其 最 好 、 最 坏 、 平 均 时 间 复 杂 度 也 分 别 为 0(1)、0O(n) 和 O(n)。 

顺便 指出 ， 对 于 顺序 表 中 插入 和 删除 时 结 点 的 大 量 移动 问题 ， 在 C/C++ 语言 中 其 实 有 
一 个 较 好 的 处 理 方 法 ， 就 是 将 顺序 表 看 成 串 ， 采 用 快速 的 串 移 动 函 数 。 具 体 就 不 细 述 了 。 

例 2.1 已 知 顺序 表 中 各 结 点 的 值 有 正 有 负 , 试 设 计算 法 使 负 值 结 点 位 于 顺序 表 的 前 面 
部 分 ， 正 值 结 点 位 于 顺序 表 的 后 面部 分 。 

解 : 对 此 问题 一 个 很 目 然 的 想法 是 ， 对 顺序 表 从 前 癌 后 搜索 《或 称 扫描 )， 迪 到 正 值 
结 扣 就 将 它 插 入 到 表 的 后 部 (或 从 后 同 前 搜索 ,过 到 负 值 结 点 就 将 它 插入 到 表 的 前 部 )。 但 
我 们 知道 ， 在 顺序 表 上 插入 或 删除 不 方便 ， 要 移动 大 量 结 点， 效率 不 高 ， 而 对 本 问题 ， 这 
种 插入 要 多 次 进行 ， 易 见 移 动 次 数 最 坏 为 O(n )。 

这 里 我 们 给 出 一 个 由 表 的 两 端 问 中 间 交 丛 扫 摘 的 算法 ， 即 先 从 前 癌 后 扫描 ， 找 到 一 个 
值 为 正 的 结 点 ， 册 从 后 加 前 扫描 ， 找 到 一 个 值 为 负 的 绪 点 ， 然 后 交换 两 者 的 内 容 。 接 看 对 
剩余 部 分 继续 进行 同样 的 过 程 ， 直 到 两 个 扫 摘 方 同 相遇 ， 整 个 表 扫 摘 处 理 完 毕 。 这 样 束 避 
免 了 大 量 结 点 的 移动 问题 ， 算 法 如 下 : 

Vold order (sqlist #L) { 

datatype x; 

2 1 

1=0;]J=L->n-—1; 

while(1<]) { 
while(i<] && LL->data[i]<0) i++; // 从 前 问 后 扫描 
while (i<j && L->data[j]>0) j--; // 从 后 问 前 扫描 


Se // 交 换 
x=L->data[il];L->data[i]=L->data[j];L->data[]j]=x; 
下 // 调 整 扫描 范围 
} 
} 
} 
显然 该 算法 的 时 间 复 杂 性 为 O(n)。 男 外 ， 从 前 后 两 端 分 别 进行 的 扫 反 可 以 并 行 处 理 ， 


但 我 们 使 用 的 计算 机 一 般 是 串 行 工 作 的 ， 所 以 只 能 交 茶 进行 。 
例 2.2 ”已 知 顺序 表 中 有 大 和 干 值 为 零 的 结 点 ， 试 设计 算法 删除 这 些 零 值 结 点 。 要 求 不 改 
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变 其 他 结 点 的 相对 位 置 。 
解 : 与 例 2.1 类 似 ， 对 此 问题 一 个 很 目 然 的 想法 是 : 单 问 扫描 ， 对 顺序 表 从 前 癌 后 扫 


摘 ， 遇 到 零 值 结 点 怠 删 除 之 ， 即 将 其 后 的 所 有 结 点 都 前 移 一 位 。 显 然 这 要 多 次 引起 大 量 续 
点 的 移动 ， 易 见 最 坏 复杂 性 为 OO- ) 。 

右 采 用 例 2.1 的 算法 : 交 从 扫 描 ， 从 前 癌 后 扫 摘 ， 找 到 一 个 堆 值 结 点 ， 册 从 后 问 前 扫 
摘 ， 找 到 一 个 非 零 值 结 点 ， 然 后 两 者 交换 。 这 时 复杂 性 虽然 为 O(n)， 但 会 改变 结 点 间 的 相 
对 位 置 。 

这 里 给 出 一 个 改进 的 单 癌 扫 摘 算 法 : 每 扫描 到 一 个 零 元 ， 并 不 马上 删除 它 “〈 即 不 调整 
其 他 结 点 的 位 置 )， 而 是 累计 当前 的 零 元 数 s; 每 扫 拉 到 一 个 非 零 元 , 就 将 其 前 移 s 个 位 置 。 
这 时 每 个 非 零 结 点 最 多 移动 1 次 ， 复 杂 性 为 O(n)， 且 不 改变 它们 的 相对 位 置 。 算 法 如 下 : 


Vold purge (sqlist #L) { 


人 二 
Ss=0; 
for (1=0;1<L-—>n;1++) 
if (L->data[i]==0) s++; // 累 计 零 元 数 
else if(s>0) L=->data[i-s]=L->data[i]l];y  // 非 零 元 前 移 s 位 
} 
En // 调 整 表 长 


} 

以 上 介绍 了 双 回 扫描 和 单 问 扫描 的 两 个 典型 算法 ， 它 们 是 一 些 较 复 杂 算 法 的 一 个 基础 
《如 以 后 将 要 介绍 的 快速 排序 算法 )。 有 些 问 题 这 两 种 扫 擂 方法 要 有 选择 地 使 用 〈 如 上 面 的 
两 个 例子 )， 但 有 些 问 题 这 两 种 方法 都 可 ， 区 别 不 大 。 


例 2.3 将 顺序 表 中 各 结 点 逆 置 ， 即 ai 和 an 互 换 、az 和 ami 互 换 等 。 
解 : 互 换 的 一 般 规 律 是 ai 和 an-ir 互 换 ， 其 中 1<i<n/2， 这 可 通过 一 个 从 前 问 后 的 单 问 
扫描 来 实现 : 


for (i=1;i<n/2;i++) 交换 a; 和 a,_;,; 


这 里 循环 上 限 /2 和 目标 位 置 ai+l 的 下 标 n-itl 均 要 计算 出 来 .如 条 采用 双 回 扫描 就 
可 避免 这 个 问题 ， 并 且 算 法 也 很 简洁 : 


for (i=1,j=n;i<j;i++,j--) 交换 a; 和 a;; 


当然 也 可 采用 while 循环 〈 略 ， 对 本 例 没 有 for 循环 简洁 )。 
2&s 线性 表 的 链接 实现 


由 上 区 的 讨论 可 知 ， 线 性 表 的 顺序 表 表 示 ， 其 特点 是 用 物理 位 置 上 的 邻接 关系 来 表示 


结 点 间 的 逻辑 关 系 ， 这 一 特点 使 得 顺序 表 有 如 下 的 优 缺 点 。 
(1) 无 须 为 表示 结 点 间 的 旬 辑 关系 而 增加 额外 的 存储 空间 。 


(2) 可 以 方便 地 随机 存 取 表 中 任 一 结 点 。 
(3) 方法 简单 ， 各 种 高 级 语言 中 都 有 数组 类 型 ， 容 易 实现 。 
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其 缺点 是 : 

(1) 插入 或 删除 运算 不 方便 ， 除 表 尾 的 位 置 外 ， 在 表 的 其 他 位 置 上 进行 插入 或 删除 操 
作 都 必须 移动 大 量 的 结 点 ， 效 率 较 低 。 

(2) 需要 预先 分 配 〈 静 态 分 配 ) 足够 大 的 连续 存储 空间 。 寿 分配 过 大 ， 则 顺序 表 后 面 
的 空间 可 能 长 期 闲置 而 得 不 到 充分 利用 ;， 夺 分 配 过 小 ， 又 可 能 在 使 用 中 因 空 间 不 足 而 造成 
溢出 。 

为 了 克服 顺序 表 的 缺点 ， 可 以 采用 链接 方式 存储 线性 表 ， 通 利 将 链接 方式 存储 的 线性 
表 称 为 (线性 ) 链表 〈Linked List)。 链 表 是 用 一 组 任意 的 存储 单元 来 存放 线性 表 的 结 点 ， 
这 组 存储 单元 既 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 ， 其 至 是 零散 分 布 在 内 存 中 的 任何 位 置 
上 。 因 此 ， 链 表 中 结 点 的 人 巡 辑 次 序 和 物理 次 序 不 一 定 相 同 。 为 了 能 正确 表示 结 点 间 的 好 辑 
关系 ， 在 存储 每 个 结 点 值 的 同时 ， 还 必须 存储 其 后 继 或 前 趋 结 点 的 地 址 (或 位 置 ) 信息 ， 
这 个 信息 称 为 指针 〈pointer) 或 链 (link)。 链 表 正 是 通过 结 点 的 链 域 将 线性 表 的 各 个 结 点 
按 其 多 辑 顺序 链接 在 一 起 的 。 人 简单 地 说 ， 链 表 就 是 用 指针 表示 结 点 间 的 锡 辑 关系 。 

本 世 以 下 主要 从 两 个 角度 来 讨论 链表 : 根据 链表 总 空间 构成 的 特点 ， 将 链表 分 为 动态 
链表 和 蓄 态 链表 ; 根据 指针 链接 方式 的 人 不同， 将 链表 分 为 单 链表 、 循 环 链表 和 双 和 链表。 其 
中 重点 讨论 单 链表 。 特 别 指出 的 是 ， 链 接 存储 是 最 种 用 的 存储 方法 之 一 ， 它 不 仅 可 用 来 表 
未 线性 表 ， 而 且 可 以 用 来 表示 各 种 非 线 性 的 数据 结构 ， 在 以 后 的 各 章节 中 将 反复 使 用 。 

在 本 书 中 ， 一 种 数据 结构 的 链接 实现 是 指控 链 式 存储 方式 构建 其 存储 结构 ， 并 在 此 存 
储 结构 上 实现 其 基本 运算 。 


2.3.1 单 链 表 


在 单 链 表 中 , 每 个 结 点 由 两 部 分 信息 组 成 , 一 个 是 数据 域 , 用 来 存放 结 点 的 值 (内容); 
男 一 个 是 指针 域 ( 亦 称 链 域 )， 用 来 存放 结 点 的 直接 后 继 的 地 址 (或 位 置 )。 所 有 结 点 通过 
指针 域 链接 在 一 起 , 构成 一 个 链表 , 其 中 每 个 结 点 只 有 一 个 指针 域 , 故 称 之 为 单 链 表 (Singly 
Linked List)。 数 据 域 和 指针 域 一 般 用 data 和 next 表示 ， 结 点 结构 为 : 

单 链 表 每 个 结 点 的 地 址 存放 在 其 前 趋 结 点 的 
next 域 中 ， 但 开始 结 点 无 前 趋 ， 故 应 另外 用 一 个 


指针 来 指向 它 ， 这 个 指针 称 为 头 指针 ， 存 放 这 个 
指针 的 变量 称 为 头 指针 变量 ， 一 般 用 head 表示 。 
另外 ,终端 结 点 无 后 继 , 它 的 指针 域 为 空 , 即 NULL yew 
(图 示 中 第 用 人 表示 )。 例 如 , 图 2.4 是 线性 表 (75, 03， head 
26, 78, 90, 55) 的 单 链表 示意 图 , 这 里 假设 指针 和 数 
据 各 占 两 个 字 节 的 存储 空间 。 

由 于 单 链表 只 注重 结 点 间 的 逻辑 顺序 ， 并 不 关 
心 每 个 结 点 的 实际 存储 位 置 ， 因 此 通常 用 箭头 来 表 
示 指 针 域 中 的 指针 ， 从 而 将 链表 简洁 直观 地 画 成 用 册 
箭头 链接 起 来 的 结 点 序列 。 例 如 图 2.4 所 示 单 链表 人 
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可 以 画 成 图 2.5 的 形式 。 


head 
于 "[6[ [2[ 4 … 一 [55[] 


2.5 单 链表 的 一 般 图 示 法 


如 条 给 定 了 头 指针 , 也 就 知道 了 单 链表 第 一 个 结 点 的 位 置 , 于 是 沿 看 指针 链 就 可 以 “ 顺 
节 换 瓜 ” 地 找到 表 中 任 一 结 点 ， 而 表 中 任 一 结 点 也 只 有 通过 指 癌 它 的 指针 才能 访问 ， 所 以 


头 指 针 变 量具 有 标识 单 链 表 的 作用 ， 或 者 说 ， 单 链表 由 头 指针 唯一 确定 。 因 此 单 链 表 可 以 
用 头 指针 变量 的 名 字 来 命名， 如 图 2.5 所 示 的 单 链 表 就 称 为 表 head 或 head 表 。 


音 链 表 的 类 型 定义 如 下 : 

typedef int datatype; // 结 点 数据 类 型 ， 假 设 为 int 
typedef struct node * pointer; // 结 点 指针 类 型 

struct node { // 结 点 结构 


datatype data; 
pointer next; 
ww pointer lklist; // 单 链表 类 型 ， 即 头 指针 类 型 

其 中 ， 

(1) pointer 是 指 癌 struct node 类 型 变量 的 指针 类 型 。 

(2) struct node 是 结构 体 类 型 ， 规 定 一 个 结 点 是 由 两 个 域 (data 和 next) 组 成 的 记录 
(每 个 域 实际 上 相当 于 一 个 变量 )， 其 中 data 是 结 点 的 数据 域 ，next 是 结 点 的 指针 域 ， 后 者 
类 型 为 pointer ( 即 struct node *)。 

(3) lklist 是 一 个 与 pointer 相同 的 类 型 ， 但 名 字 不 同 。 以 后 我 们 用 lklist 来 说 明 头 指针 
变量 的 类 型 ， 也 即 用 来 作为 单 链 表 的 类 型 ; 用 pointer 来 说 明 单 链表 一 般 结 点 (包括 工作 结 
点 ) 的 指针 类 型 。 这 样 ， 对 于 说 明 语句 “1lklistA; ”， 我 们 想到 的 是 A 为 单 链 表 的 头 指针 ， 
也 即 A 表示 一 个 单 链 表 ; 而 对 于 说 明 语 句 “pointer A; ”， 我 们 想到 的 是 A 为 一 个 普通 结 点 
的 地 址 。 一 般 地 ， 同 一 类 型 取 不 同名 字 可 用 来 说 明 类 型 相同 但 作用 不 同 的 变量 ， 即 把 类 型 
赋予 一 定 的 “语义 2”， 有 利于 提高 程序 的 可 读 性 。 

指针 的 概念 是 链 式 存储 结构 的 核心 。 要 正确 区 分 指针 变量 、 指 针 、 指 针 所 指 的 结 点 、 
结 点 变量 和 绪 点 的 内 容 〈 结 点 的 值 ) 等 儿 个 密切 相关 的 不 同 概念 。 假 设 p 是 一 个 pointer 
类 型 的 指针 变量 ， 则 

(1) p 的 值 是 一 个 指针 。 但 大 p 未 初始 化 或 未 赋 过 值 ， 则 p 的 值 无 意义 ,或 称 p 无 值 。 

(2) 该 指针 硅 为 NULL， 则 不 指 问 任 何 结 点 ; 否则 是 茶 个 struct node 类 型 结 点 的 地 址 ， 
或 者 说 ， 该 指针 指 问 该 结 点 。 这 个 结 点 用 *p 来 标识 ， 其 值 是 结 点 的 内 容 。 注 意 ， 单 链表 的 
任何 结 点 都 只 能 用 指向 它 的 指针 变量 来 标识 。 

(3) 链表 的 结 点 空间 一 般 都 是 动态 分 配 的 ， 所 以 通 币 p 所 指 的 结 点 变量 并 不 在 程序 的 
变量 说 明 部 分 显 式 地 定义 〈 故 没有 名 字 )， 而 是 在 程序 执行 过 程 中 ， 当 需要 时 才 临 时 产生 ， 
故 称 为 动态 变量 。 它 通过 C++ 的 new 运算 符 产 生 ， 即 


p=new node; 


上 式 分 配 一 个 node 大 小 的 连续 字 节 空间 , 返回 一 个 指 加 该 地 址 的 指针 ,并 将 该 指针 存 
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入 指针 变量 p 中 。 
严格 说 来 ， 用 new 运算 符 动态 申请 内 存 空 间 时 应 检测 申请 是 否 成 功 ， 即 该 空间 指针 是 
否 为 NULL， 如 为 NULL 则 系统 已 无 可 分 配 的 空间 (如 内 存 耗 尽 )。 但 如 果 程 序 的 数据 量 
不 大 ， 一 般 不 会 出 现 这 种 情况 ， 所 以 ， 为 了 简便 起 见 ， 本 书 一 般 不 考虑 空间 不 足 的 情况 。 
一 旦 p 所 指 的 结 点 变量 不 再 需要 了 ， 就 可 通过 C++ 的 delete 运算 符 释 放 其 所 占 空间 : 


delete p; 


因此 ， 我 们 无 法 通过 预先 定义 的 标识 从 去 访问 这 种 动态 的 结 点 变量 ， 而 只 能 通过 指针 
p 来 访问 它 ， 即 用 x*p 作为 该 结 点 变量 的 名 字 来 访问 。 注 意 ， 如 条 p 值 为 定 ， 则 它 不 指 问 任 
何 结 点 ， 这 时 ， 通 过 *p 来 访问 结 点 意味 看 访问 一 个 不 存在 的 变量 ， 从 而 引起 程序 错误 。 

(4) p 所 指 癌 的 结 点 类 型 是 结构 (记录 ) 类 型 ， 要 访问 它 的 成 员 可 用 成 员 选 择 运 算 符 : 
(*p).data、(*p).next 或 指针 指 问 运算 符 : p 一 >data、p 一 >next。 

有 关 指 针 的 详细 知识 ， 请 参考 C/C++ 语言 的 有 关 资 料 。 

以 下 为 叙述 方便 ， 将 不 册 严 格 区 分 指针 变量 和 指针 这 两 个 概念 ， 如 将 头 指针 变量 称 为 
头 指 针 ， 将 修改 某 指 针 变 量 的 值 称 为 修改 东 指 针 等 。 


2.3.2 ” 单 链 表 上 的 运算 


下 面 讨论 单 链 表 上 的 一 些 运算 实现 ， 注 意 ， 这 里 并 不 限于 线性 表 的 几 种 基本 运算 。 

由 于 链表 的 结 点 空间 是 动态 分 配 的 ， 所 以 我 们 不 声明 结 点 变量 本 映 ， 而 是 声明 指 癌 结 
点 变量 的 指针 ， 然 后 在 需要 时 ， 用 运算 符 new 分 配 结 点 空间 ; 相应 地 ， 在 结 点 不 再 有 用 时 
要 用 运算 符 delete 释放 结 点 空间 , 特别 地 , 在 程序 结束 时 应 该 将 链表 的 所 有 结 点 空间 释放 ， 
故 需要 增加 一 个 销毁 运算 。 

在 这 里 还 要 特别 注意 链表 运算 的 一 个 基本 特点 : 治 指针 搜索 《或 称 扫 朱 )， 它 是 很 多 


算法 的 基础 ， 在 本 书后 面 的 图 、 树 等 章节 中 这 一 特点 会 更 加 明显 。 

1. 建 表 

本 来 使 用 链表 的 第 一 步 应 该 是 初始 化 ， 但 这 里 为 了 引入 头 结 点 的 概念 ， 先 介绍 单 链 表 
的 建立 。 这 样 一 来 ， 初 始 化 的 有 关 工 作 要 在 建 表 时 完成 。 

假设 线性 表 中 结 点 的 数据 类 型 是 字符 (这 时 前 述 单 链表 的 类 型 定义 中 ， 把 结 点 数据 类 


型 从 int 改 为 char)， 我 们 逐个 输入 这 些 字 符 型 的 结 点 ， 并 以 '$' 为 输入 结束 标志 从。 动态 地 
建立 单 链表 的 第 用 方法 有 如 下 两 种 。 

(1) 尾 插 法 建 表 

该 方法 是 将 新 结 点 插 到 当前 链表 的 表 尾 上 。 即 从 一 个 空 表 开 始 ， 每 读 入 一 个 数据 ， 就 
生成 一 个 新 结 点 ， 将 数据 存放 到 结 点 的 数据 域 中 ， 册 将 新 结 点 插入 到 当前 链表 的 表 尾 ， 如 
此 反复 ， 直 至 读 入 结束 标志 为 止 。 

如 果 链 表 只 有 头 指针 , 则 每 次 插入 时 都 要 先 从 表 头 开始 找到 表 尾 , 然后 才能 真正 插入 。 
由 于 在 已 有 i 个 结 点 的 链表 上 从 表 头 开始 找到 表 尾 的 时 间 复 杂 度 为 1, 所 以 建 表 的 时 间 复 杂 
度 将 为 1+2+…+(n-1)=n(n-1)/2=O(n”)， 效 率 很 低 。 为 此 增加 一 个 尾 指针 rear， 使 其 始终 指 
问 当 前 链表 的 尾 结 点 。 尾 插 过 程 见 图 2.6 所 示 。 
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(a) 无 头 结 点 (b) 有 头 结 点 
图 2.6 尾 插 法 建 单 链表 
当 插 入 第 一 个 结 点 时 ， 链 表 由 空 变 为 非 空 ， 需 要 修改 头 指针 《使 之 由 空 变 为 指 问 第 一 
个 结 点 )， 以 后 册 插 入 新 结 点 时 头 指 针 不 变 ， 但 要 修改 尾 指针 使 之 指 问 新 的 尾 结 点 )。 最 


后 ， 如 果 链表 不 空 ， 要 将 尾 结 点 的 后 继 指针 置 空 。 可 见 ， 空 表 和 非 空 表 要 分 别处 理 ， 略 显 
烦琐 ， 具 体 算法 略 。 

对 此 问题 可 采用 如 下 技巧 : 在 链表 的 第 一 个 结 点 之 前 附加 一 个 类 型 相同 的 结 点 ， 称 之 
为 头 结 点 ， 并 将 头 指针 指向 头 结 点 。 这 时 ， 无 论 链表 是 否 为 空 ， 头 结 点 总 存在 ， 即 头 指针 
总 不 为 空 。 这 可 使 空 表 和 非 空 表 的 处 理 统一 起 来 ， 而 不 必 单 独处 理 ， 这 就 是 头 结 点 带 来 的 
好 处 。 比 如 插入 第 一 个 结 点 与 以 后 插入 其 他 结 点 的 操作 完全 一 样 ， 无 须 特殊 处 理 。 

除了 头 结 点 外 ， 链 表 的 其 他 结 点 统称 为 表 结 点 。 表 结 点 中 的 第 一 个 和 最 后 一 个 分 别称 
为 首 结 点 和 尾 结 点 。 带 头 结 点 的 单 链表 如 图 2.7 所 示 ， 图 中 阴影 部 分 表示 头 结 点 的 数据 域 ， 
不 存储 信息 ， 但 在 有 的 应 用 中 ， 也 可 用 来 存放 某 种 特殊 标志 或 表 的 长 度 等 附加 信息 。 

表 结 点 
头 结 点 。” 首 结 点 尾 结 点 head 关 结 所 
ti" alle [aA | 


(a) 非 空 表 (b) 空 表 
图 2.7 带头 结 点 的 单 链表 
引入 头 结 点 后 ， 尾 插 法 建立 单 链表 的 算法 可 简化 为 : 


lklist creat2() { // 尾 插 法 建 表 ， 有 头 结 点 ， 返 回 表 头 指 针 
pointer head, rear, s; 
char ch; 
head=new node; // 生 成 头绪 点 
rear=head: // 尾 指针 初 值 指 问 头 结 点 
while (cin>>ch,ch!='’$') { // 读 入 结 点 值 ， 并 检测 是 否 为 结束 符 
s=new node; // 生 成 新 结 点 
s—->data=ch; 
rear—>next=s; // 新 结 点 插入 表 尾 
rear=s; // 尾 指针 rear 指 回 新 的 表 尾 
} 
rear—->next=NULL; // 尾 结 点 的 后 继 指针 为 衬 
return head; 
} 
注意 其 中 利用 C/C++ 语言 的 人 逗号 运算 符 ， 将 输入 结 点 的 语句 放 到 了 while 条 件 中 。 


附加 头 结 点 后 ， 单 链表 上 的 其 他 很 多 算法 ， 特 别 是 涉及 插入 与 删除 操作 时 ， 也 可 取得 
类 似 的 效果 ， 即 不 必 单 独处 理 链 表 是 人 否 会 由 空 变 为 非 空 ， 或 者 由 非 空 变 为 空 这 些 “边界 ” 
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情况 ， 而 将 空 表 和 非 空 表 统一 处 理 ， 使 有 关 算 法 大 为 简化 。 夯 外 ， 一 般 说 来 ， 链 表 由 空 变 
为 非 空 ， 或 者 由 非 空 变 为 空 的 情况 很 少 ， 比 如 只 发 生 一 次 ， 大 量 的 时 候 这 关 检 测 实 际 上 是 
多 余 的 ， 如 条 能 省 挥 这 些 检测 语句 ， 还 可 提高 算法 的 时 间 性 能 。 所 以 在 实际 应 用 中 ， 经 季 


在 单 链 表 上 附加 头 结 点 。 但 要 注意 ， 头 结 点 多 辑 上 并 不 属于 线性 表 ， 只 是 一 种 技术 处 理 。 
(2) 头 插 法 建 表 
该 方法 是 将 新 结 点 插 到 当前 链表 的 表 头 上 。 如 果 链 表 无 头 结 点 , 头 插 过 程 见 图 2.8 (a)， 
注意 这 里 不 必 对 第 一 个 结 点 单独 处 理 。 如 宋 链表 有 头绪 点 ， 则 从 有 头 结 点 的 空 表 开始 ， 每 
次 在 头 结 点 后 插入 新 结 点 ， 算 法 如 下 : 
head head 


， 1@ ' /®@ 
ef] | 


(a) 无 头 结 点 (b) 有 头绪 点 
图 2.8 头 插 法 建 单 链表 
lklist creat() { // 头 插 法 建 表 ， 有 头 结 点 ， 返 回 表 头 指针 
lklist head:; 
pointer s; 
char ch; 
head=new node; // 生 成 头绪 点 ， 头 指针 初 值 指 四 头 结 点 


head—>next=NULL; 
while (cin>>ch,ch!=’$') { // 输 入 结 点 值 ， 并 检测 是 否 为 结束 符 


s=new node; // 生 成 新 结 点 
s—->data=ch; // 装 入 数据 
s—>next=head—>next; 
head->next=s; // 将 新 结 点 插入 到 头 结 点 后 
} 
return head; 
} 
头 插 法 建立 链表 的 算法 也 很 简单 ， 但 链表 中 结 点 的 次 序 和 输入 时 相反 。 寿 和布 望 二 者 次 
序 一 致 ， 则 只 能 用 尾 插 法 建 表 。 
2. 初始 化 
初始 化 即 建立 一 个 只 有 头 结 点 的 空 表 ， 算 法 如 下 : 


lklist initlist() { 
pointer head; 
head=new node; 
head—>next=NULL; 
return head; 


} 


3. 求 表 长 
算法 思想 是 从 首 结 点 开始 沿 着 指针 链 癌 后 搜索 ， 逐 个 统计 表 结 点 数 ， 一 直 统 计 到 尾 结 


点 为 止 ， 得 到 的 结 点 总 数 即 表 长 。 由 于 要 沿 着 链表 搜索 ， 需 要 一 个 工作 变量 来 指示 当前 位 


置 ， 它 的 变化 规律 是 ， 每 统计 完 一 个 结 点 ， 如 指 同 下 一 个 结 点 。 求 表 长 的 算法 如 下 : 


int length (lklist head) { 


SM 
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int 耻 7 
pointer p; 
]=0; // 计 数 器 
p=head->next; // 从 首 结 点 开始 搜索 
while(p!=NULL) { 

]++;? 

p=p-—>next; // 到 下 一 个 结 点 


} 


return J]; 


} 


4. 按 序号 查找 

在 顺序 表 中 ， 要 访问 序号 为 i 的 结 点 可 通过 数组 下 标 直 接 访 问 ， 因 为 数组 可 随机 存 取 。 
但 链表 不 行 ， 它 的 结 点 在 空间 上 的 分 布 没 有 规律 ， 不 能 随机 存 取 ， 只 能 从 链表 开始 部 分 沿 
者 指针 链 回 后 顺序 查找 ， 一 直 搜 索 到 第 i 个 点 为 止 。 这 一 过 程 与 求 表 长 有 些 类 似 ， 但 这 里 
不 是 一 直 搜 索 到 尾 结 点 。 


设 表 长 为 n， 则 要 查找 的 结 点 号 i 应 满足 1<i<n， 但 我 们 有 时 需要 把 头 结 点 形式 上 看 
成 是 第 0 号 结 点 《上 自 结 点 的 “前 趋 ?”)， 这 样 ， 当 三 0 时 返回 头绪 点 《比如 在 后 面 将 介绍 的 
插入 算法 中 ， 大 插入 点 为 第 1 个 结 点 ， 则 需要 先 找 到 它 的 “前 趋 "”， 即 第 0 号 结 点 )。 按 序 
写 查 找 的 算法 如 下 : 

pointer get (lklist head,int i) {// 结 点 号 i 的 有 效 东 围 是 0<i<n 

i 


pointer p; 
if (i==0) return head; //0 与 结 点 为 头 结 点 
if(i<0) return NULL; // 位 置 非法 ， 无 此 结 点 
J]=0; / /计数 器 
p=head->next; // 从 首 结 点 开始 搜索 
while(p!=NULL) { 

J++;1if (J==1) break; 

p=p->next:; // 没 有 搜索 到 第 工 个 点 ， 继 续 下 一 个 结 点 
} 
return p; // 未 找到 时 P 自动 为 NULL 

} 


上 面 站 语句 检查 非法 位 置 时 ， 条 件 本 应 为 i<0 或 i>=n， 但 链表 长 度 n 尚未 知 ， 故 对 i>n 
的 检测 就 留 给 了 后 和 面 的 while 循环 。while 循环 结束 时 有 两 种 可 能 : 找到 或 未 找到 第 1 个 结 
点 , 本 应 分 情况 返回 p 或 NULL, 但 注意 到 未 找到 时 , p 搜索 到 尾 结 点 外 ( 即 i>n), p=NULL， 
返回 p 也 即 返 回 NULL， 所 以 算法 返回 时 未 加 区 分 。 

5. 定位 〈 按 值 查找 ) 

算法 思想 : 从 首 结 点 开始 沿 看 指针 链 搜索 ， 逐 个 检查 每 个 结 点 的 数据 域 ， 看 它 是 否 是 
所 要 查找 的 结 点 ;， 夺 是 则 返回 该 结 点 的 地 址 ， 否 则 返回 NULL。 算 法 与 按 序 与 查找 类 似 ， 
但 查找 的 目标 不 同 ， 这 里 不 是 找 第 1 个 点 ， 而 是 找 数据 域 的 值 。 

pointer locate(lklist head,datatype x) { 

pointer p; 

p=head-—>next; // 从 首 结 点 开始 搜索 

while(p!=NULL) { 


1f (p->data==x) break:; 
p=p-—>next; // 到 下 一 个 结 点 
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} 
return p; // 未 找到 时 pp 自动 为 NULL 
} 


上 面 while 循环 结束 时 也 没有 按 找到 或 没 找到 分 别 返 回 ， 原 因 与 按 序 号 查找 时 相同 。 


在 定位 时 要 求 返 回 找到 的 结 点 号 ， 没 找到 就 返回 -1 (0 代表 头 结 点 )， 则 算法 如 下 : 
int locate (lklist head,datatype x) { 

nt 3 

pointer p; 

= // 计 数 器 

p=head->next:; // 从 首 结 点 开始 扫描 


while(p!=NULL) { 
j++;if (p->data==x) break;// 找 到 了 xx， 退出 循环 


p=p—>next; // 没 找到 ， 继 续 扫描 下 一 个 结 点 
} 
if(p!=NULL) return ]j; // 找 人 到 J 了 x 
else return -1; // 没 有 x， 查找 失败 
} 
6. 插入 运算 


实现 插入 运算 INSERT(L, x, iD) 的 基本 步骤 如 下 : 
(1) 在 链表 中 找到 插入 位 置 ， 这 可 通过 按 序号 查找 〈get) 来 实现 。 
(2) 生成 一 个 以 x 为 值 的 新 结 点 。 


(3) 将 新 结 点 插入 。 
插入 过 程 见 图 2.9， 要 使 插入 的 绪 点 成 为 新 的 第 1 个 结 点 ， 需 要 修改 原 第 于 1 个 结 点 的 
后 继 指 针 ， 使 之 指 癌 新 结 点 ; 新 结 点 的 后 继 是 原 第 1 个 结 点 。 这 样 ， 在 第 (1) 步 中 实际 需 
要 找 第 六 1 个 结 点 的 地 址 q 而 不 是 第 1 个 结 点 的 地 址 p。 算 法 如 下 : 
head q (p) 


、 ~、 SS 
Ma la el al 一 La 

\ ” 

S xT 


图 2.9 在 单 链表 第 i 个 位 置 插入 结 点 


int insert (lklist head,datatype x,int 1) { 
pointer 9q,s; 


q=get (head,i—-1); // 找 第 i-1 个 点 

if (gq==NULL) {cout<<”“ 非 法 插入 位 置 !\n”;return 0;}// 无 第 i-1 个 结 点 ， 即 1<1 或 1>n+l 时 
s=new node; // 生 成 新 结 点 

s—>data=x; 

s—->next=q->next; // 新 结 点 的 后 继 是 原 第 i 个 点 

q-—>next=s; // 原 第 i-1 个 结 点 的 后 继 是 新 结 点 

return 1; // 插 入 成 功 


} 

注意 上 面 修改 指针 s->next 和 q->next 的 两 条 语句 的 顺序 不 能 颠倒 ， 人 否则 在 先 修改 了 
q->next=s; 则 原 第 i 个 结 点 的 位 置 束 不 知道 了 。 一 般 规则 是 先 修改 新 结 点 的 指针 (这 时 不 
影响 其 他 结 点 )， 再 修改 旧 结 点 的 指针 。 
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在 链表 的 插入 中 还 会 遇 到 这 种 情况 : 已 经 知道 了 某 结 点 的 位 置 〈 而 不 是 序号 )， 需 要 
在 该 结 点 之 前 或 之 后 插入 一 个 结 点 。 显 然 ， 在 该 结 点 之 前 插入 一 个 结 点 (前 插 ) 不 方便 ， 
裔 要 先 从 头 指针 开始 找到 该 结 点 的 前 趋 ( 束 像 上 和 面 在 第 1 结 点 前 插入 一 个 结 点 时 需要 找 第 
i 一 1 个 结 点 一 样 )， 然 后 才能 真正 进行 插入 ， 执 行 时 间 与 插入 位 置 有 关 ， 易 见 其 平均 时 间 复 
杂 度 为 O(n); 但 在 该 结 点 之 后 插入 一 个 结 点 〈 后 插 ) 就 比较 方便 ， 可 直接 进行 有 关 操 作 ， 
时 间 复 杂 度 是 O(1)。 当 找到 某 结 点 的 前 趋 后 ， 前 插 问 题 实际 上 便 转化 成 了 后 插 问 题 。 

不 找 前 趋 是 不 是 就 不 能 进行 前 插 操作 呢 ? 这 里 给 出 一 个 简单 的 等 效 方法 : 先 把 新 结 点 
插 在 当前 结 点 *p 之 后 ， 然 后 交换 这 两 个 结 点 的 内 容 。 这 样 得 到 的 链表 逻辑 上 与 原来 在 xp 
之 前 插入 等 效 ， 如 图 2.10 所 示 。 主 要 算法 步骤 如 下 : 

Pp、 Ee 
S| | Sa | 
—*|x| | :oa 


(a) 插入 前 (b) 插入 后 
图 2.10 ”等 效 的 前 插 操 作 示意 图 


(1) s=new node; 

(2) s->data=p->data; 

(3) s—->next=p->next; 

(4) p->data=x; 

(5) p->next=s; 

显然 ， 改 进 后 的 前 插 算 法 时 间 复 杂 度 是 0(1)。 注 意 ， 由 于 结 点 *s 的 内 容 要 交换 ， 数 据 
x 并 不 需 真 的 装 入 其 中 后 再 交换 ， 而 是 xp->*s，x->#p; 与 物理 前 插 相 比 (这 时 为 x>*s)， 
多 了 一 次 结 点 数据 的 复制 。 知 结 点 数据 域 的 信息 量 较 大 ， 复 制 会 增加 一 定 的 时 间 开 销 。 

比较 上 述 两 种 插入 操作 可 知 ， 除 了 在 表 的 第 一 个 位 置 上 的 前 插 操作 外 ， 表 中 其 他 位 置 
上 的 前 插 操 作 都 没有 后 插 操 作 简便 。 因 此 在 一 般 情况 下 ， 应 尽量 把 单 链 表 上 的 插入 操作 转 
化 为 后 插 操 作 。 

7. 删除 运算 

根据 删除 运算 DELETE(L.,D 的 定义 ， 可 知 其 基本 步骤 为 : 


(1) 找到 第 1 个 结 点 ， 这 可 通过 按 序号 得 找 〈get) 来 实现 。 

(2) 删除 该 结 点 。 

结 点 删除 流程 见 图 2.11， 设 当前 要 删除 的 结 点 (第 1 个 结 点 ) 地 址 为 p， 则 删除 时 要 
修改 其 前 趋 的 后 继 指 针 ， 使 之 指 癌 当 前 结 点 的 后 继 。 所 以 在 第 (1) 步 ， 实 际 上 要 找 第 江 1 
个 结 点 的 地 址 q。 算 法 如 下 : 

head、、 q (p) 


Ee EE se ETE EIE eaENE sg EN 
~、 vy 
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2.11 在 单 链 表 上 删除 第 i 个 结 点 


第 2 章 线性 表 2 


int delete (lklist head,int 1) 1{ 

pointer p,q; 

q=get (head, i-—1); // 找 待 删 结 点 的 直接 前 趋 

if(gq==NULL || q->next==NULL) // 即 1<1 或 1>n 时 
{cout<<“ 非 法 删除 位 置 !\n”; return 0;} 

p=q—>next; / /保存 待 删 结 点 的 地 址 ， 用 于 释放 空间 

q—->next=p->next; // 修 改 前 趋 的 指针 

delete p; / /释放 已 删除 的 结 点 空间 

return 1; / /删除 成 功 

} 

上 和 面 的 站 语句 有 两 个 条 件 : q==NULL 表示 等 删 结 点 的 前 趋 不 存在 ; q-->next==NULL 
表示 符 删 结 点 本 喘 不 存在 。 这 是 因为 前 趋 存 在 并 不 能 保证 符 删 结 点 也 存在 ， 如 链表 长 度 为 
n， 帮 要 删除 第 Fn+l 个 结 点 ， 它 实际 上 不 存在 ， 但 它 的 “前 趋 ” 第 二 1 个 结 点 却 存在 ， 即 
终端 结 点 。 对 不 存在 的 结 点 实行 删除 操作 ， 如 取 它 的 后 继 ， 释 放 它 的 空间 等 是 错误 的 。 

注意 ， 上 述 算法 中 奎 没 有 语句 delete p， 则 链表 上 虽然 没有 了 结 点 xp， 但 它 仍 占用 内 存 
空间 ， 却 又 不 起 作用 ， 形 成 内 存 垃 圾 。 随 看 这 种 结 点 的 增多 ， 内 存 滔 费 越 来 越 严重 ， 可 用 
内 存 越 来 越 少 ， 最 终 将 会 影响 到 程序 的 正常 运行 2。 所 以 链表 中 不 需要 的 结 点 要 及 时 将 其 
空间 释放 。 

在 链表 的 删除 中 还 会 出 现 这 样 一 种 情况 ， 即 已 经 知道 了 某 结 点 的 位 置 〈 而 不 是 该 结 点 
的 序号 )， 需 要 删除 该 结 点 或 其 后 继 。 显 然 ， 删 除 该 结 点 本 有 身 《〈 目 删 ) 不 方便 ， 需 要 先 从 头 
指针 开始 找到 该 结 点 的 前 趋 ( 就 像 上 面 删除 第 1 个 结 点 时 需要 找 第 江 1 个 结 点 一 样 )， 然 后 
才能 真正 进行 删除 ， 执 行 时 间 与 删除 位 置 有 关 ， 吻 见 其 平均 时 间 复 洒 上 度 为 O(n); 但 删除 该 
结 点 的 后 继 (后 删 〉 比 较 方便 ， 可 直接 进行 有 关 操 作 ， 时 间 复 杂 度 是 O(1)。 当 找到 茶 结 点 
的 前 趋 后 ， 目 删 问题 实际 上 便 转 化 成 了 后 删 问题 。 

不 找 前 趋 是 不 是 就 不 能 删除 当前 结 点 呢 ? 这 里 给 出 一 个 简单 的 等 效 方法 : 先 将 当前 结 
点 *p 后 继 的 值 复制 到 当前 结 点 中 ， 然 后 删 去 当前 结 点 的 后 继 ， 见 图 2.12。 这 样 得 到 的 链表 
逻辑 上 与 原来 删除 xp 等 效 。 主 要 算法 步骤 如 下 : 


人 
oe | | ll ES 


(a) 删除 前 (b) 删除 后 
图 2.12 等 效 的 自 删 操作 示意 图 


(1) r=p->next; 
(2) pSdata=r->data; 
(3) p->next=r->next; 
(4) delete r; 


但 此 方法 要 求 sp 有 后 继 ， 也 就 是 说 ， 它 不 能 是 终端 结 点 。 与 物理 自 删 相 比 ， 多 了 一 次 
结 点 数据 的 复制 。 


GO 这 就 是 所 谓 的 内 存 泄漏 memory leak)。 类 似 ， 程 序 结束 时 最 终 各 链表 中 的 所 有 结 点 〈 包 括 头 结 
点 ) 也 要 逐个 将 其 空间 释放 ， 这 可 通过 增加 销毁 函数 来 完成 。 
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8. 销毁 运算 
链表 的 销毁 比较 简单 ， 就 是 从 头 到 尾 将 所 有 结 点 空间 释放 ， 算 法 如 下 : 


void destroy(lklist head) { 
pointer p,q; 
p=head; // 从 头 结 点 开始 
while(p!==NULL) { 
q=p—>next; 
delete p; 
p=q; 
} 
} 


以 上 各 算法 的 时 间 复 杂 度 除了 初始 化 为 O(1) 外 ， 其 他 都 是 On)。 


从 上 面 的 讨论 可 以 看 到 ， 链 表 上 实现 的 插入 和 删除 运算 ， 无 须 移动 结 点 ， 仅 需 修改 有 
关 指针 。 
例 2.4 将 单 链表 中 的 结 点 就 地 逆 置 ( 即 在 原 结 点 上 修改 ， 辅 助 结 点 空间 为 0(1))。 


解 : 参见 图 2.13， 设 单 链表 有 头 结 点 。 运 算 规 则 是 依次 将 旧 链 表 中 的 结 点 郑 头 插 到 新 
链表 中 。 头 插 后 #p 的 next 被 修改 ,不 能 由 其 搜索 到 原 后 继 ， 所 以 在 修改 该 指针 之 前 ， 先 将 
其 后 继 *r 的 位 置 保存 起 来 。 算 法 如 下 : 
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图 2.13 单 链 表 就 地 逆 置 ( 头 插 法 ) 


Vold reverse(lklist head) 1{ 
pointer p,r; 


p=head—>next; //P 指 问 旧 链表 结 点 
head->next=NULL; // 新 链表 从 空 开始 〈 头 结 点 用 旧 链 表 的 ) 
while(p!=NULL) { 
r=p—>next; 
p->next=head->next; // 头 插 
head—>next=p; 
P= 工 7 
} 
} 
本 例 也 可 直接 扫描 链表 ， 将 各 结 点 的 next 指针 改 为 指向 其 前 趋 ， 具 体 算 法 略 。 


2.3.3 ”循环 链表 


循环 链表 (Circular Linked List) 是 一 种 首尾 相 接 的 链表 。 其 特点 是 无 须 增加 存储 量 ， 
仅 对 表 的 链接 方式 稍 作 改变 ， 就 可 使 表 的 处 理 更 加 方便 灵活 。 

在 单 链表 中 ， 将 尾 结 点 的 指针 域 由 NULL 改 为 指 问 头 结 点 或 首 结 点 ， 就 得 到 了 单 链 形 
式 的 循环 链表 ， 人 简称 为 单 循 环 链表 。 这 相当 于 将 尾 结 点 的 后 继 视 为 头 结 点 或 首 结 点 ， 将 头 
结 点 或 首 结 点 的 前 趋 视 为 尾 结 点 。 类 似 地 ， 还 有 多 重 链 的 循环 链表 ， 如 双 循 环 链表 ( 见 下 
节 )。 单 循环 链表 中 ， 表 中 所 有 结 点 被 链 在 一 个 环 上 ， 多重 循环 链表 则 是 将 表 中 结 点 链 在 多 
个 环 上 。 循 环 链表 中 头 结 点 也 能 起 到 使 空 表 和 非 空 表 的 处 理 一 致 的 作用 。 计 头 结 点 的 单 循 
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环 链表 如 图 2.14 所 示 ， 其 中 空 循环 链表 只 有 头 结 点 并 目 成 循环 。 
aa SHH TH 
(a) 非 空 表 (b) 空 表 
图 2.14 单 循环 链表 示意 图 
在 用 头 指针 表示 的 单 循环 链表 中 ， 找 首 结 点 ai 的 时 间 是 0(1)， 然 而 要 找到 尾 结 点 an， 


则 须 从 头 指针 开始 过 历 整 个 链表 ， 其 时 间 是 O(n)。 在 很 多 实际 问题 中 ， 表 的 操作 常常 要 在 
表 的 首尾 位 置 上 进行 , 此 时 头 指 针 表 示 的 单 循 环 链表 就 显得 不 够 方便 ,如果 改 用 尾 指 针 rear 
来 表示 单 循 环 链表 ， 见 图 2.15， 则 查找 首 结 点 ai 和 尾 结 点 an 都 很 方便 ， 它们 的 存储 位 置 分 
别 是 rear->next->next 和 rear， 显 然 ， 查 找 时 间 都 是 O(1)。 因 此 ， 使 用 中 常用 尾 指针 来 表 
示 单 循环 链表 。 


ME NEE pA Cp ear 


(a) 非 空 表 (b) 空 表 
图 2.15 用 尾 指针 表示 的 单 循 环 链表 


在 单 循 环 链表 中 ， 从 任 一 结 点 出 发 都 可 访问 到 表 中 所 有 结 点 ， 这 一 优点 使 得 茶 些 运算 
易于 实现 。 而 在 单 链表 中 ， 只 有 从 头 结 点 〈 或 首 结 点 ) 开始 才能 扫描 到 表 中 全 部 结 点 ， 从 
茶 一 结 点 出 发 只 能 访问 到 该 结 点 及 其 后 续 结 点 ， 无 法 找到 该 结 点 之 前 的 其 他 结 点 。 

例 2.5 多 项 式 的 表示 。 

解 : 一 元 n 次 多 项 式 : 

frx)=anxa 十 ax 十 … 十 a1x 十 ao 

由 n+l 个 系数 唯一 确定 ， 在 例 1.1 曾 提 到 ， 这 些 系 数 中 可 能 有 很 多 是 零 ， 为 了 节约 空间 ， 
并 与 书写 习惯 一 怪我 们 只 存储 非 零 系数 。 可 将 各 系数 组 织 成 一 个 链表 ， 每 个 结 点 表示 一 
个 系数 项 ， 包 含 三 部 分 信息 : 系数 仁 、 指 数 和 后 继 指针 ， 其 中 后 继 指针 指出 下 一 个 系数 结 
点 的 位 置 , 从 而 将 各 个 结 点 链接 起 来 , 结 点 结构 的 示意 图 见 图 2.16 (a)。 以 多 项 式 x+3X +2 
为 例 ， 它 可 用 图 2.16 (b〉 所 示 的 链表 表示 (也 可 以 用 非 循 环 链表 表示 )。 


系数 指数 
co |exp | next| ‘ead SB .TH ET .ED 


(a) 结 点 结构 (b) 多 项 式 x*+3x +2 
图 2.16 多 项 式 的 循环 链表 表示 
结 点 的 类 型 定义 与 单 链表 类 似 ， 只 是 数据 域 有 两 个 : co 和 exp， 这 里 略 。 


2.3.4 双 链 表 


在 单 链表 中 ， 每 个 结 点 含有 后 继 指针 ， 因 此 找 茶 个 结 点 的 后 继 比较 方便 ， 由 后 继 指 针 
直接 可 得 ; 但 找 前 趋 束 不 方便 了 ， 需 要 进行 租 找 : 如 果 是 单 循环 链表 ， 可 从 该 结 点 出 发 沿 
后 继 指 针 逐 个 合 找 ， 时 间 耗 费 是 O(n); 如 果 不 是 循环 链表 ， 则 只 能 从 头 结 点 或 首 结 点 出 发 
进行 得 找 ， 平 均 时 间 耗 费 也 是 Oo)。 大 而 望 能 快速 确定 一 个 结 点 的 前 趋 ， 则 可 在 单 链 表 的 
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每 个 结 点 里 再 增加 一 个 指 问 其 前 趋 的 指针 域 ( 见 图 2.17 (a))。 这 样 形 成 的 链表 含有 指 问 前 
趋 和 后 继 两 个 方 同 的 链 ， 称 之 为 双向 ) 链表 (Doubly Linked List)， 见 图 2.17 (b)、(c)。 


prior data next 


[LT head .| "Ta eae [HAA 


(a) 结 点 结构 (b) 非 空 的 双 链 表 (c) 空 的 双 链 表 
head 2 head 
ce ED 
(d) 非 空 的 双 循 环 链表 (e) 空 的 双 循 环 链表 


图 2.17 双 链 表示 意图 
双 链 表 类 型 定义 如 下 : 


typedef int datatype; // 结 点 数据 类 型 ， 假 设 为 int 
typedef struct dnode *dpointer; 
struct dnode f{ 
datatype data; 
dpointer prior,next; 
Er dpointer dlklist; 
和 单 链表 类 似 ， 双 链表 一 般 也 由 头 指 针 head 唯一 确定 ,增加 头 结 点 也 能 使 双 链 表 上 的 
菏 些 运算 变 得 方便 ， 将 头 结 点 和 尾 结 点 链接 起 来 也 能 构成 循环 链表 ， 称 为 双 (向 ) 循环 链 
表 ， 如 图 2.17 (d) 和 图 2.17〈e) 所 示 。 
回顾 单 链 表 的 插入 和 删除 运算 ， 其 前 插 不 如 后 插 方 便 ， 删 除 某 结 点 *p 上 自 喘 不 如 删除 *p 
的 后 继 方 便 ， 原 因 是 表 中 只 有 一 条 后 继 链 ， 运 算 中 需要 但 找 结 点 的 前 趋 ， 不 方便 。 双 链表 
结构 是 一 种 对 称 结 构 ， 既 有 前 趋 链 又 有 后 继 链 ， 这 束 使 得 两 种 插入 操作 和 两 种 删除 操作 都 
方便 。 设 指针 p 指 回 双 链 表 的 茶 一 结 点 ， 则 双 链 表 绪 构 的 对 称 性 可 用 下 式 刻 男 


P->PFIOF->next=p=p->nexXt 一 >prIoOF 


亦 即 结 点 各 的 存储 位 置 既 存 放 在 其 前 趋 结 点 *(p->prior) 的 后 继 指针 域 中 ， 也 存放 在 其 
后 继 结 点 *(p->nexb 的 前 趋 指针 域 中 。 

双 链 表 的 运算 如 求 表 长 、 按 序号 查找 、 定 位 等 与 单 
链表 基本 相同 ， 主 要 不 同 是 插入 和 删除 运算 ， 因 为 这 时 -Eee 
要 修改 两 条 链 。 下 面 考虑 两 个 对 单 链表 运算 比较 困难 的 


,0 Py 
颁 为 : 


() s=new dnode; 

© s->data=x; 

@) s->next=p; 

由 s—->prior=p->prior; 
© p->prior->next=s; 
p—>prior=s; 
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这 里 要 修改 4 个 指针 。 注 总 其 中 语句 的 次 序 : 语句 @ 必 须 位 于 语句 由 、@@ 之 后 ,否则 ， 
先 打 断 了 p->prior 这 条 链 ， 以 后 束 不 能 从 Pp 获得 p 的 前 趋 了 。 一 般 规则 与 单 链表 相同 ， 即 


先 修改 新 结 点 的 指针 (这 时 不 影响 其 他 结 点 )， 再 修改 旧 结 点 的 指针 ,但 这 里 涉及 两 个 旧 结 
点 ， 则 先 修改 其 原 值 不 再 有 用 的 指针 。 ， 
可 类 似 写 出 在 结 点 gp 之 后 插入 x 的 操作 步 又 ER 


( 略 )， 可 以 看 到 ， 对 双 链表 来 说 ,前 插 并 不 比 后 插 … 一 LIETHeETa[DIE[T … 
困难 ， 它 们 一 样 方便 。 ee - 

(2) 删除 结 点 *p 自身 。 如 图 2.19 所 示 ， 主 要 图 2.19” 双 链表 删除 结 点 *p 
语句 为 : 

() p->prior->next=p->next; 

© p->next->prior=p->prior; 

(3) delete p; 

这 里 修改 两 个 指针 的 语句 次 序 可 交换 。 

因为 双 链 表 上 的 前 插 操 作 和 删除 某 结 点 *p 目 喘 的 操作 都 很 方便 , 所 以 在 双 链 表 上 实现 
有 关 插 入 和 删除 时 ， 无 须 转 化 为 后 插 操 作 及 删 去 结 点 后 继 的 操作 。 例 如 ， 在 双 链 表 的 第 1 
个 位 置 上 插入 或 删除 ， 可 直接 找到 表 的 第 1 个 结 点 gp， 然 后 用 上 面 的 方法 处 理 即 可 ， 而 不 
必 像 处 理 单 链表 那样 ， 先 找到 第 i 个 结 点 的 前 趋 才 能 进行 ， 所 以 双 链 表 表 示 显 得 更 为 目 然 
和 方便 。 

顺便 指出 ， 双 链表 在 实现 时 ， 也 可 只 用 一 个 指针 域 ， 但 该 指针 域 存 放 的 是 前 趋 和 后 继 
地 址 的 异 或 值 ，prior^next( 对 头 结 点 : NULL^next=next， 对 尾 结 点 priorANULL=prior )。 
这 样 ， 从 首 结 点 开始 ， 已 知 其 前 趋 prior( 即 head)， 就 可 求 出 后 继 next=(prior^next) 人 ^prior。 
类 似 地 ， 如 果 已 知 某 点 的 后 继 next， 则 可 求 出 其 前 趋 prior=(prior^next)^next。 这 里 利用 了 
异 或 运算 的 特点 : 连续 两 次 异 或 得 怕 值 。 显 然 ， 这 种 处 理 节 省 了 指针 宇 间 ， 但 增加 了 运行 
时 间 。 


2.3.5 ”静态 链表 


以 上 介绍 的 各 种 链表 都 是 由 指针 实现 的 ， 链 表 中 结 点 空间 的 分 配 和 回收 〈 即 释 放 ) 由 
系统 提供 的 运算 符 new 和 delete 动态 执行 ， 故 称 为 动态 链表 。 但 是 有 的 高 级 语言 没有 “ 指 
针 ” 数 据 类 型 ， 比 如 BASIC、FORTRAN 等 ， 这 是 否 就 不 能 使 用 链表 呢 ? 

在 C/C++ 语言 中 ,指针 指 的 是 数据 的 物理 地 址 ， 即 其 存储 位 置 。 注意 到 这 样 一 个 事实 ， 
如 果 一 批 数据 是 用 数组 组 织 的 ， 则 为 了 指出 某 个 元 素 的 位 置 ， 只 需 指 出 数组 的 下 标 就 可 以 
了 ， 这样 , 数组 的 下 标 实际 上 也 是 一 种 “指针 ”。 按 此 思想 , 我 们 就 可 以 用 数组 来 实现 链表 : 


六 


将 数据 存放 到 数组 中 ， 相 互 间 的 人 巡 辑 关系 用 数组 下 标 来 表示 。 类 似 单 链 表 ， 这 里 每 个 结 点 
也 要 存储 两 个 信息 , 一 个 是 结 点 本 里 的 数据 , 一 个 是 其 后 继 结 点 的 数组 下 标 (指针 )。 这 样 ， 


所 再 数组 网 是 一 个 结构 数组 ， 每 个 数组 元 陛 由 两 部 分 组 成 。 最 后 这 种 链表 也 由 头 指针 唯一 
确定 。 

例如 ， 图 2.20 (a) 所 示 的 结构 数组 中 存放 的 就是 线性 表 (a1, az, a3, a4)。 对 比 图 2.4， 不 
难 发 现 ， 这 两 种 链表 本 质 上 并 没有 什么 不 同 : 图 2.4 中 的 指针 是 结 点 的 物理 地 址 ， 这 里 的 
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指针 是 结 点 的 数组 下 标 , 它 本 质 上 与 物理 地 址 是 对 应 的 。 为 了 区 分 , 把 这 里 的 指针 称 为 “ 游 
标 〈《Cursor)”。 但 在 不 至 于 混淆 时 ， 习 惯 上 还 是 把 游标 称 作 指针 。 接 下 来 ， 也 可 以 写 出 “分 
配 结 点 ”和 “回收 结 点 ”的 过 程 。 

显然 ， 图 2.20 中 空 指针 应 该 为 -1， 这 时 不 能 
册 用 C/C++ 语言 的 NULL 来 表示 空 指 针 了 ， 因 为 
它 被 定义 为 0。 为 此 ， 一 个 方法 是 将 数组 的 0 号 单 
元 视 为 “ 空 ”而 不 用 ， 从 而 继续 用 NULL 表示 空 
指针 。 本 节 采 用 另 一 个 方法 , 即将 空 指针 用 另 一 符 
号 NIL 表示 ， 并 将 其 定义 为 -1。 

可 见 , 用 游标 实现 链表 的 方法 是 : 定义 一 个 规 
模 较 大 的 结构 (有些 语 言 称 记录 ) 数组 作为 备用 结 head PE 


点 空间 〈 即 存储 池 )。 当 申请 结 点 时 ， 从 存储 池内 “区 二-[alj-[a[ 填 [ad 了 j [as 
取出 一 个 结 点 ; 当 释 放 结 点 时 ， 将 结 点 归还 到 存储 (b) 逻辑 状态 
池内 。 由 于 要 预先 给 备用 结 点 静态 分 配 一 个 连续 空 
筷 让 人 局 入 分 配 | 连 卖 图 2 20 ”静态 链表 示意 图 
间 ， 故 把 用 游标 实现 的 链表 称 为 静态 链表 (Static 
Linked List )。 
静态 链表 的 类 型 定义 如 下 : 
const int maxsize=100; // 存 储 池 的 容量 ， 假 设 为 100 
typedef int datatype; // 结 点 数据 类 型 ， 假 定 为 int 
typedef int cursor; / /游标 类 型 
const cursor NIL=-1; / /静态 链表 空 指针 
typedef struct { 
datatype datas / /数据 域 
cursor next; / /指针 域 
} snode; // 结 点 类 型 
snode nodepool [maxsizel]; // 存 储 池 data next 
cursor sp; / /游标 变量 0 [+ 
om YY 天 a 1 
对 于 双 链表 ， 在 定义 中 要 增加 一 个 前 趋 指针 。 注意 ， 了 一 1 
头 指针 和 其 他 指针 的 类 型 是 cursor。 如 果 所 用 语言 没有 结 [5] 3 
构 (记录 ) 类 型 ， 则 可 将 存储 池 用 两 个 数组 data[maxsize] 
. | maxsize—1 
和 next[maxsize] 来 实现 。 maxsize-1| [NT 
为 了 便于 结 点 空间 的 分 配 和 回收 ， 通 利 将 存储 池 中 0 
所 有 的 可 用 结 点 链 成 一 个 链表 ， 并 称 之 为 可 用 空间 表 或 0 加 
， a yr 开 | 四 
备用 空间 表 ， 它 的 头 指针 设 为 sp， 类 型 是 cursor。 在 结 “一 *:[ 了 [5 [> … 一 [CA 
点 分 配 和 回收 中 要 使 用 sp， 为 了 避免 参数 的 频繁 传递 ， (b) 逻辑 状态 
这 里 将 sp 设 为 全 局 量 。 初 始 的 可 用 空间 表 sp 是 数组 的 | 
全 部 单元 ， 可 简单 地 将 它们 依次 串 接 起 来 ， 见 图 2.21， 人 


对 应 的 初始 化 算法 如 下 : 
Vold initialize() { 
3 


for (i=0; i<maxsize—1;i++) // 依 次 链接 存储 池 中 各 结 点 
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nodepool [1i] .next=1I+1:; 
nodepool [maxsize-1] .next=NIL; // 最 后 一 个 结 点 的 指针 域 为 NIL 


Sp=0; 

} 

可 用 衬 间 表 sp 建立 后 ， 束 可 以 实现 结 点 空间 的 分 配 和 回收 。 为 此 ， 我 们 定义 两 个 函数 
newnode 和 deletenode 来 实现 new 和 delete 的 功能 。 当 需要 分 配 一 个 结 点 时 调用 函数 
newnode， 从 表 sp 上 取 走 第 一 个 结 点 空间 ， 并 在 sp 中 删除 该 结 点 。 奋 要 归还 一 个 结 点 ， 则 
调用 函数 deletenode， 将 该 结 点 插入 到 表 sp 的 头 上 。 下 面 是 实现 这 两 个 函数 的 算法 。 

cursor newnode () { // 从 sp 表 上 分 配 一 个 结 点 , 返回 分 配 到 的 可 用 结 点 


cursor p; 
if (sp==NIL) return NIL;  // 未 分 配 到 结 点 


p=sp; //P 指 问 分 配 a 到 的 结 点 
sp=nodepool[sp] .next; // 从 sp 表 上 删除 分 配 走 的 结 点 
return p; // 返 回 分 配 到 的 结 点 
} 
deletenode (cursor p) { // 将 p 所 指 的 结 点 归还 到 sp 表 中 
nodepool [pl] .next=sp; 
sp=p; // 将 释放 的 结 点 插入 表 sp 的 第 一 个 结 点 之 前 
} 


在 经 过 多 次 结 点 的 分 配 和 回收 后 ， 存 储 池 的 空间 就 不 一 定 连 续 而 变 得 比较 寒 乱 了 ， 这 
与 动态 链表 类 似 ， 但 并 不 影响 我 们 的 使 用 。 

南 要 指出 ， 静 态 链 表 申 请 结 点 空间 时 ， 一 定 要 检 答 申请 的 结果 是 否 为 空 ， 奋 空 则 意味 
看 存储 池 已 满 ， 可 用 空间 表 已 用 完 。 这 是 因为 存储 池 数 组 大 小 总 是 有 限 的 ， 使 用 中 要 考虑 
室 间 注 出 问题 。 而 在 动态 链表 中 ， 我 们 一 般 不 必 进 行 这 种 检查 ， 因 为 系统 分 配 的 用 户 内 存 
较 大 ， 一 般 不 需要 考虑 空间 洲 出 问题 ， 除 非 程 序 或 数据 量 特别 大 。 

定义 了 newnode 和 deletenode 之 后 ， 并 注意 到 游标 和 指针 的 对 应 关系， 就 不 难 由 动态 
链表 上 的 算法 得 到 静态 链表 上 的 相应 算法 。 游 标 和 指针 的 对 应 天 系 是 : 静态 链表 中 的 游标 
p 是 问 量 的 下 标 , 它 所 指 的 结 点 是 nodepool[p], 由 p 同 后 搜索 的 语句 为 “p=nodepool[pl.next; ”， 
动态 链表 中 的 指针 p 是 结 点 的 地 址 ， 它 所 指 的 结 点 是 *p， 由 p 问 后 搜索 的 语句 为 
“p=p->next;”。 这 里 仅 举 两 个 例子 。 

例 2.6 己 知 静态 链表 中 结 点 的 值 有 正 有 人 负 ， 编 写 算法 删除 其 中 值 为 负 的 结 点 。 

解 : 删除 过 程 见 图 2.22， 其 中 p 指 问 当前 结 点 ，q 指 问 其 前 趋 ， 算 法 如 下 。 


人 "0 
WA" De 本 一 LT 上 


和 
-~ 


人 
人 


2.22 ”删除 静态 单 链 表 中 的 负数 结 点 


Vold deletes (cursor L) f{ 
CUrsor Dg 
网 - /V/g 从 头 结 点 开始 《后 继 P 从 首 结 点 开始 ) 
while (p=nodepool [gl] .next,p!=NIL) 
if (nodepool[p] .data<0) { // 当 前 结 点 为 负 ， 删 除 之 
nodepool [gq] .next=nodepooll[p] .next; 
deletenode (p); 
} 
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else { // 当前 结 点 非 负 ， 问 后 推进 

dpr 

} 
} 
其 中 每 次 p 取 新 值 的 语句 写 在 了 while 条 件 中 (类 似 前 述 单 链表 的 建 表 算法 )。 
例 2.7 在 市 头 结 点 的 静态 链表 上 第 1 个 结 点 ai 之 前 插入 一 个 新 结 点 X。 


解 : 算法 与 动态 链表 插入 完全 类 似 (参见 图 2.9)， 先 找到 插入 点 的 前 趋 ， 再 插入 新 结 点 。 


int insert (cursor L,datatype x,int 1) 1{ 
curasnr 0 
q=get (L,i-1); // 找 ai 前 趋 结 点 (算法 略 ) 
if (gq==NIL) {cout<<“ 插 入 位 置 非法 \n”;return 0;} 
s=newnode () ; 
if(s==NIL) {cout<<7 衬 间 已 满 ， 不 能 插入 \n7zFreturn -1;}// 未 分配 到 结 点 ， 出 错 
nodepool[s] .data=x; // 插 入 结 点 x 
nodepooll[s] .next=nodepooll[lq] .next; 
nodepool [9]j .next=s; 
下 和 七 守节 站 于》 // 插 入 成 功 

} 


&4 顺序 表 和 链表 的 比较 


前 面 几 节 介 绍 了 线性 表 的 两 种 存储 结构 : 顺序 表 和 和 链表。 其 中 ， 顺 序 表 是 用 数组 实现 
的 ， 链 表 是 用 指针 或 游标 实现 的 。 用 指针 实现 的 链表 ， 结 点 空间 是 动态 分 配 的 ， 称 之 为 动 
态 链 表 ; 用 游标 模拟 指针 实现 的 链表 ， 结 点 空间 是 静态 分 配 的 ， 称 之 为 静态 链表 。 顺 序 表 
和 链表 各 有 优 缺 点 ， 在 实际 使 用 中 如 何 选择 呢 ? 这 要 根据 具体 问题 的 要 求 和 性 质 来 决定 ， 
通常 有 以 下 几 方 和 面 的 考虑 。 

1. 基于 空间 的 考虑 

顺序 表 的 存储 空间 是 静态 分 配 的 ， 在 程序 执行 之 前 必须 明确 规定 它 的 存储 规模 。 知 线 
性 表 的 长 度 n 变化 较 大 ， 则 存储 规模 难于 预先 确定 ， 估 计 过 大 将 造成 空间 浪费 ， 估 计 太 小 
又 将 使 空间 溢出 机 会 增多 。 

静态 链表 中 ， 初 始 存 储 池 虽 然 也 是 静态 分 配 的 ， 但 阁 同 时 存在 才干 个 结 点 类 型 相同 的 
链表 ， 则 它们 可 以 共享 空间 ， 使 各 链表 之 间 能 够 相互 调节 余 缺 ， 减 少 溢出 的 机 会 。 动 态 链 
表 的 存储 空间 是 动态 分 配 的 ， 只 要 内 存 空间 尚 有 空 亲 ， 就 不 会 产生 溢出 。 

在 顺序 表 中 ， 结 点 间 的 逻辑 关系 由 其 物理 位 置 反 映 ， 即 不 必用 额外 的 空间 来 表示 逻辑 
关系 。 但 链表 中 各 结 点 的 物理 位 置 是 任意 的 ， 每 个 结 点 除了 保存 其 自身 的 数据 外 ， 还 需要 
额外 的 空间 〈 即 指针 域 或 游标 域 ) 来 表示 逻辑 关系 ， 这 从 存储 密度 来 讲 是 不 经 济 的 。 所 谓 
存储 密度 (Storage Density) 是 指 结 点 数据 本 喘 所 占 的 存储 量 和 整个 结 点 结构 所 占 的 存储 量 
之 本， Ml 

存储 密度 =( 结 点 数据 本 身 所 占 的 存储 量 ) /( 结 点 结构 所 占 的 存储 总 量 ) 

一 般 地 ， 存 储 密度 越 大 ， 存 储 空间 的 利用 率 就 越 高 。 显 然 ， 顺 序 表 的 存储 密度 为 1， 
而 链表 的 存储 密度 小 于 1。 例 如 ， 假 设 单 链 表 的 结 点 数据 为 整数 ， 且 指针 所 占 的 空间 和 整 
型 量 相 同 ， 则 单 链表 的 存储 密度 为 50%。 这 就 是 说 ， 若 不 考虑 顺序 表 中 的 备用 结 点 空间 ， 
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则 顺序 表 的 存储 空间 利用 率 为 100%， 而 单 链表 的 存储 空间 利用 率 为 50%。 

因此 ， 当 线性 表 的 长 度 变 化 较 大 ， 难 以 估计 其 存储 规模 时 ， 以 采用 动态 链表 作为 存储 
结构 为 好 ; 当 线 性 表 的 长 度 变 化 不 大 ， 易 于 事先 确定 其 大 小 时 ， 为 了 节约 存储 空间 ， 宜 采 
用 顺序 表 作 为 存储 结构 。 

2. 基于 时 间 的 考虑 

顺序 表 由 问 量 实现 ， 是 一 种 随机 存 取 结 构 ， 对 表 中 任 一 结 点 都 可 在 O(1) 的 时 间 内 直接 
存 取 ; 而 链表 中 的 结 点 ， 一 般 需 从 头 指针 起 顺 着 链 扫描 才能 取得 ， 时 间 复 杂 度 为 O(n)。 

在 链表 中 的 任何 位 置 上 进行 插入 和 删除 ， 都 只 需要 修改 指针 。 而 在 顺序 表 中 进行 插入 
和 删除 ， 平 均 要 移动 表 中 一 半 左 右 的 结 点 ， 尤 其 是 当 每 个 结 点 的 信息 量 较 大 时 ， 移 动 结 点 
的 时 间 开 销 就 相当 可 观 。 

因此 ， 大 线性 表 的 操作 主要 是 进行 查找 ， 很 少 做 插入 和 删除 操作 时 ， 采 用 顺序 表 做 存 
储 结构 为 宜 ， 对 于 频 索 进行 插入 和 删除 的 线性 表 ， 宜 采用 链表 做 存储 结构 ; 大 线性 表 的 插 
入 和 删除 主要 发 生 在 表 的 首尾 两 端 ， 则 采用 尾 指针 表示 的 单 循环 链表 为 宜 。 

3. 基于 语言 的 考虑 

一 般 高 级 语言 都 提供 了 数组 类 型 ， 所 以 顺序 表 的 实现 比较 容易 。 但 很 多 高 级 语言 并 没 
有 提供 指针 类 型 ， 这 时 奎 要 采用 链表 结构 ， 则 宕 使 用 用 游标 实现 的 静态 链表 。 虽 然 静 态 链 
表 在 存储 分 配 上 有 不 足 之 处 ， 但 它 和 动态 链表 一 样 ， 具 有 插入 和 删除 方便 的 特点 。 

值得 指出 的 是 : 即使 是 对 那些 具有 指针 类 型 的 语言 ， 静 态 链 表 也 有 其 用 武之 地 。 特 别 
是 当 线性 表 的 长 度 不 变 , 仅 需 改变 结 点 间 的 相对 关系 时 , 静态 链表 可 能 比 动态 链表 更 方便 。 


站 十 一 


2.1 fa,b, c,d, ee, 个 是 线性 表 吗 ? 
2.2” 试 述 头 指针 、 头 结 点 、 首 结 点 的 区 别 ， 并 说 明 头 指针 和 头 结 点 的 作用 。 


2.3 循环 链表 的 主要 优点 是 什么 ? 
2.4 试 对 如 下 情况 ， 写 出 顺序 表 的 类 型 定义 和 有 关 算 法 : 
(1) 假设 数组 空间 在 运行 时 动态 分 配 。 
(2) 假设 数组 空间 从 下 标 1 开始 使 用 。 
2.5 试 设 计算 法 , 删除 顺序 表 中 值 大 于 low 且 小 于 high 的 结 点 ( 若 存在 这 样 的 结 点 ): 
(1) 顺序 表 无 序 。 
(2) 顺序 表 递 增 有 序 。 
2.6 试 设计 算法 : 
(1) 删除 顺序 表 中 重复 的 元 素 〈 相 同 的 元 素 上 只 保留 第 一 个 )， 要 求 元 素 的 移动 次 
数 要 少 。 
(2) 删除 顺序 表 中 重复 的 零 元 素 ， 要 求 元 素 的 移动 次 数 要 少 。 
(3) 删除 顺序 表 中 所 有 的 零 元 素 ， 要 求 元 素 的 移动 次 数 要 少 。 
2.7 试 设 计算 法 ， 仅 用 一 个 辅助 结 点 ， 完 成 下 列 要 求 ， 并 分 析 算 法 的 时 间 复 杂 度 : 
(1) 将 数组 中 的 元 素 循 环 右 移 k 位 。 
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C2 将 数组 [ai， a2.“”“，an， Dis Da, bm| 调 整 为 [bi, b> i an|。 
2.8 ”假定 用 递增 有 序 的 线性 表 表 示 和 集 合 ， 编 写 算法 求 集合 的 交集 。 


2.9 ”删除 单 链表 中 结 点 的 值 在 low 和 high 之 间 的 结 点 (车 存在 这 样 的 结 点 )。 
2.10 ” 试 设计 算法 ， 将 两 个 递增 有 序 的 单 链表 就 地 合并 为 一 个 递增 有 序 的 单 链表 。 
2.11 试 设计 算法 ， 判 断 两 个 单 链表 的 结 点 是 否 构 成 如 下 数列 : 

(1) 递增 (27 千 赵 LSE SL 


2.12 试 写 出 两 个 一 元 多 项 式 相 加 的 算法 。 


栈 、 队 列 和 串 | 


栈 和 队列 是 两 种 特殊 的 线性 表 ， 它 们 的 逻辑 结构 和 线性 表 相 同 ， 只 是 其 运算 规则 较 线 
性 表 有 一 些 限制 ， 故 又 称 为 运算 受 限 的 线性 表 。 很 多 问题 可 直接 用 栈 和 队列 来 描述 ， 有 些 
算法 也 必须 借助 它们 来 实现 ， 栈 和 队列 在 程序 设计 中 有 痢 广 泛 的 应 用 。 

串 《〈 又 称 字 符 串 ) 也 是 一 种 特殊 的 线性 表 ， 只 是 其 元 素 的 类 型 有 限制 ， 即 每 个 结 点 仅 
由 一 个 字符 组 成 。 事 物 的 名 称 、 源 程序 等 都 是 串 。 计 算 机 上 非 数值 处 理 的 对 象 也 基本 上 都 
挟 串 。 


本 章 将 介绍 栈 、 队 列 和 串 的 有 关 概 念 、 存 储 结构 ， 以 及 基本 运算 。 
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3.1.1 栈 的 基本 概念 


栈 (Stack) 是 限制 仅 在 表 的 一 端 进行 插入 和 删除 运算 的 线性 表 ， 通 常 称 插入 、 删 除 的 
这 一 端 为 栈 顶 (Top)， 另 一 端 称 为 栈 底 Bottom)。 插 入 和 删除 也 分 别称 为 进 栈 (入 栈 ) 和 
出 栈 ( 退 栈 )。 当 表 中 没有 任何 元 素 时 称 为 空 栈 。 处 于 栈 顶 位 置 的 元 素 称 为 栈 顶 元 素 。 

根据 上 述 定义 ， 每 次 删除 〔 退 栈 ) 的 总 是 当前 栈 中 “最 新 ”的 元 素 ， 即 最 后 插入 〈 进 
栈 ) 的 元 素 ， 而 最 先 插入 的 元 素 被 放 在 栈 的 底部 ， 要 到 最 后 才能 删 。 ,8 有 
除 。 在 图 3.1 所 示 的 栈 中 ， 元 素 是 以 a1, a2，…, au 的 顺序 进 栈 ， 而 退 mn 
栈 的 次 序 却 是 au ao_1，…, a1。 也 就 是 说 ,， 栈 的 修改 是 按 “后 进 先 出 ” 栈 项 一 | a _ 

的 原则 进行 的 。 因 此 ， 栈 又 称 为 后 进 先 出 (LIFO，Last In First Out) 
或 先进 后 出 (FILO，First In Last Out) 的 线性 表 。 WE 

栈 的 例子 在 日 常生 活 中 也 可 见 到 ， 如 一 释 书 或 一 疤 盘 子 ， 若 规 栈 底 一 | al | 
定 从 中 取出 一 件 或 放 入 一 件 都 只 能 在 顶部 进行 ， 那 它 就 是 一 个 栈 。 图 3 1 栈 示意 图 
又 如 一 台 机 器 的 拆 、 装 过 程 显然 应 该 按 栈 的 方式 进行 。 

栈 在 计算 机 系统 中 的 应 用 更 多 ， 如 记录 中 断 返 回 地 址 〈 断 点 ) 的 结构 就 是 栈 。 在 中 断 
发 生 时 ， 为 了 处 理 完 中 断 事件 后 恢复 被 中 断 事件 的 继续 执行 ， 需 记 下 断 点。 在 允许 多 级 中 
断 的 情况 下 ， 中 断 处 理 过 程 又 可 能 被 其 他 中 断 所 中 断 ， 因 此 ， 系 统 可 能 要 保存 多 个 断 点 。 
由 于 中 断 恢复 是 先 恢复 最 近 被 打 断 的 过 程 ， 于 是 要 求 断 点 的 取出 次 序 与 保存 次 序 相 反 ， 即 
后 保存 的 先 取 出 ， 这 正 是 栈 的 特征 。 
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设 S 表示 栈 ， 栈 的 基本 运算 有 5 种 : 

(1) 初始 化 INITIAITE(S)。 加 工 型 运算 ， 其 作用 是 设置 一 个 空 栈 。 此 后 其 他 操作 才能 
进行 。 

(2) 判 栈 空 EMPTY(S)。 引 用 型 运算 ， 寿 栈 $ 为 定 ， 返 回 1， 人 否则 返回 0。 

(3) 进 栈 PUSH(S,x)。 加 工 型 运算 ， 在 栈 顶 插入 《上 压 入 ) 元 素 x，x 成 为 新 的 栈 顶 元 素 。 

(4) 退 栈 POP(S): 加 工 型 运算 ， 将 栈 顶 元 素 删除 〈 弹 出 )， 并 返回 该 元 素 。 

(5) 取 栈 项 GETTOP(S): 引用 型 运算 , 取 栈 项 元 素 , 但 不 删除 它 。 这 点 不 同 于 POP(S)。 

根据 需要 ， 还 可 增加 判 栈 满 FULL(S) 的 运算 。 以 上 运算 (3) 一 〈5) ， 对 特殊 情况 〈 如 
栈 满 或 栈 空 时 ) 需要 特殊 处 理 ， 如 返回 特殊 标志 等 。 

由 于 栈 是 运算 受 限 的 线性 表 ， 因 此 线性 表 的 存储 结构 对 栈 也 适用 ， 即 一 般 采 用 顺序 存 
储 和 链 式 存储 。 栈 项 位 置 随 铸 进 栈 和 退 栈 操 作 而 变化 ， 故 需要 一 个 变量 top 来 指示 它 的 当 
前 位 置 。 通 常 称 top 为 栈 顶 指针 。 栈 底 位 置 不 变 ， 且 运算 也 不 涉及 它 ， 故 不 需要 设置 栈 底 
指针 。 


3.1.2 ” 栈 的 顺序 实现 


栈 的 顺序 存储 结构 人 条 称 为 顺序 栈 ， 它 是 运算 受 限 的 顺序 表 。 顺 序 栈 用 回 量 来 实现 。 辣 
量 两 端的 位 置 是 固定 不 变 的 , 可 将 栈 乓 设 为 其 中 的 任何 一 病 , 但 习惯 上 设 在 下 标 小 的 那 闹 ; 
为 指出 栈 顶 位 置 ， 实 际 上 只 需 指 出 它 在 数组 中 的 下 标 即 可 ， 故 栈 项 指针 top 取 为 整 型 。 由 
于 插入 和 删除 只 能 在 栈 项 进行 ， 故 顺序 栈 中 的 插入 和 删除 操作 不 存在 元 素 移 动 的 问题 。 顺 
序 栈 的 类 型 定义 如 下 : 

typedef int datatype;  // 栈 元 素 的 数据 类 型 ， 假 设 为 整 型 

const int maxsize=100; // 栈 的 容量 ， 元 素 最 多 不 能 超过 它 ， 此 处 设 为 100 

typedef struct { 

datatype data[lmaxsizel]; 
int top; 

} sqstack; / /顺序 栈 类 型 定义 

顺序 栈 被 定义 为 一 个 结构 类 型 ， 它 有 两 个 域 : data 和 top。data 为 一 维 数 组 ， 用 于 存放 
栈 的 元 素 ，datatype 为 栈 元 素 的 类 型 ， 震 要 根据 实际 情 癌 来 指定 ， 上 面 设 为 int。top 即 栈 项 
指针 指向 真正 的 栈 顶 ”)， 它 的 有 效 范围 为 0 一 maxsize-1。 如 果 栈 底 位 置 固 定 在 向 量 的 低 
站 ， 那 么 top=-1 表示 栈 空 ，top=maxsize-]1 表示 栈 满 。 

与 顺序 表 类 似 , 顺序 栈 也 可 从 数组 下 标 1 开始 使 用 , 数组 大 小 定义 为 data[maxsize+1]， 
data[0] 不 用 ， 或 用 来 表示 栈 项 指针 。 这 时 top=0 表示 栈 衬 ;top=maxsize 表示 栈 满 。 

当 栈 满 时 册 做 进 栈 运算 则 产生 空间 溢出 ， 简 称 “ 上 洪 ”: 当 栈 空 时 再 做 退 栈 运 算 也 产生 滋 
出 ， 人 向 称 “下 溢 ”。 上 洲 是 一 种 出 错 状态 ， 应 该 设法 避免 :; 下 洲 则 可 能 是 正常 现象 ， 因 为 在 程 
序 中 使 用 时 ， 栈 初 态 或 终 态 都 是 空 栈 ， 所 以 下 洲 帝 音 用 来 作为 程序 控制 转移 的 条 件 。 

图 3.2 说 明了 在 顺序 栈 中 做 进 栈 和 退 栈 运算 时 ， 栈 中 元 素 和 栈 项 指针 的 关系 。 注 意 : 
退 栈 后 ， 元 素 D、C 并 没有 必要 迫 去 ， 但 已 不 起 作用 ， 以 后 有 元 素 进 栈 时 ， 目 动 将 其 图 闸 。 


(D 有 的 文献 中 top 指 问 真正 的 栈 项 的 后 一 个 位 置 ， 即 top-1 才 是 真正 的 栈 顶 。 这 时 top=0 表示 栈 空 ; 
top=maxsize 表示 栈 满 ， 相 应 地 ， 栈 运算 的 有 关 实 现 需 略 作 调整 。 
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(a) 空 栈 (b) A 进 栈 (c) B、C、D 依次 进 栈 (d) D、C 退 栈 (e) E、F、G、 瑟 依次 
进 栈 ， 栈 满 


3.2 栈 顶 指针 和 栈 中 元 素 之 间 的 关系 


在 顺序 栈 上 实现 栈 的 5$ 种 基本 运算 如 下 。 
1. 初始 化 


Vold init sqstack(sqstack *sq) { 
sq—>top=—1; 
} 


2. 判 栈 空 


Int empty sqstack (sqstack *sq) { 
1f (sq->top==-1) return 1; 
else return 0; 

} 


3. 进 栈 

int push sqstack(sqstack *sq,datatype x) { 
if (sq->top==maxsize-1) {cout<<”“ 栈 满 ， 不 能 进 栈 ! \n”;return 0;} // 上 洲 
sq->data[++sq->top]=x; // 栈 项 指针 加 1， 将 zx 插入 当前 栈 项 


return 1; 
} 


4. 退 栈 


int pop sqstack(sqstack *sq,datatype *x) { // 栈 顶 元 素 值 由 参数 返回 
if (sq->top==-1) {cout<<“ 栈 空 ， 不 能 退 栈 ! \n”;return 0;} // 下 淤 
*x=sq->data[sq->top--];  ”// 取 出 栈 顶 元 素 值 给 x， 栈 顶 指针 减 1 


return 1; 
} 


5. 取 栈 项 


int gettop sqstack(sqstack *sqg,datatype *x) { // 栈 顶 元 素 值 由 参数 返回 
if(sq->top==-1) {cout<<“ 栈 空 ， 无 栈 顶 可 取 ! \n”;return 0;}// 栈 空 
*x=sq—>data[sq->top]; // 取 出 栈 顶 元 素 值 给 x 
return 1; 

} 


注意 ， 以 上 退 栈 、 取 栈 项 时 ， 栈 项 元 素 值 不 是 通过 函数 值 来 返回 的 ， 因 为 当 栈 空 时 无 
返回 对 象 ， 需 要 特殊 处 理 〈( 如 返回 某 个 特定 的 “ 容 值 ”)。 男 外 ， 前 已 指出 ， 退 栈 时 ， 原 栈 
顶 元 素 并 没有 必要 真正 擦 去 , 所 以 在 算法 pop sqstack 中 , 删 去 栈 顶 元 素 只 是 将 栈 顶 指针 减 
1， 即 该 元 素 在 下 次 进 栈 之 前 仍然 是 存在 的 ， 见 图 3.2 (d)。 
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当 一 个 程序 中 同时 使 用 多 个 顺序 栈 时 ， 为 了 防止 上 洲 ， 需 要 为 每 个 栈 分 配 一 个 较 大 的 
空间 ， 但 实际 上 茶 一 栈 发 生 上 海 时 ， 可 能 其 余 栈 剩余 的 空间 还 很 多 ， 如 末 我 们 将 这 多 个 栈 
安排 在 同一 个 同 量 里 ， 即 让 多 个 栈 共 亨 存储 空间 ， 束 可 以 相互 调节 余 缺 ， 这 样 既 可 克 约 存 
储 空间 ， 又 可 降低 发 生 上 游 的 概率 。 当 然 ， 这 样 做 的 一 个 前 提 是 ， 这 些 栈 的 类 型 要 相同 ; 
还 要 求 各 个 栈 不 会 同时 出 现 最 多 元 素 的 情况 。 

以 同时 使 用 两 个 栈 为 例 ， 将 两 个 栈 的 栈 确 分 别 设 在 癌 量 空间 的 两 闹 ， 使 两 个 栈 各 目 问 
中 间 延 伸 ， 见 图 3.3。 这 样 当 一 个 栈 的 元 素 较 多 ， 超 过 癌 量 空间 的 一 半 时 ， 只 要 为 一 个 栈 
的 元 素 丰 多， 那么 前 者 束 可 以 占用 后 者 的 部 分 存储 空间 ， 只 有 妆 整 个 癌 量 空间 被 册 个 栈 占 
满 ( 即 两 个 栈 顶 相 过 ) 时 ， 才 发 生 上 深 。 因 此 ， 两 个 栈 共 至 一 个 长 上 度 为 m 的 癌 量 空间 和 两 
个 栈 分 别 占 用 两 个 长 度 为 my2 的 癌 量 空 间 相 比 ， 前 者 发 生 上 洲 的 概率 比 后 者 要 小 得 多 。 特 
别 地 ， 如 果 已 知 这 2 个 栈 在 任何 时 刻 的 总 长 度 都 不 会 超过 m， 则 该 方法 是 非常 实用 的 。 


栈 1 栈 2 
Sa es 


elle bal 
| 一 妈 一 1 
栈 1 底 栈 1 顶 栈 2 顶 ” 栈 2 底 


图 3.3 两 个 栈 共 享 向 量 空间 示意 图 


但 当 k(k 二 2) 个 栈 共 享 癌 量 空间 时 ， 夺 条 个 栈 上 洲 而 其 余 栈 中 尚 有 剩余 空间 ， 则 必 
须 移动 茶 个 或 几 个 栈 才能 为 产生 上 滋 的 栈 腾 出 空间 ， 处 理 较 烦 琐 上 且 效 率 较 低 。 


3.1.3 村 的 链接 实现 


栈 的 链 式 存储 结构 称 为 链 栈 ， 它 是 运算 受 限 的 单 链 表 ， 插 入 和 删除 操作 限制 在 链表 的 
一 站 进行 。 链 表 的 建立 有 头 插 法 和 尾 插 法 ， 显 然 ， 采 用 头 插 法 并 取 链 表 的 头 部 作 栈 顶 是 合 
适 的 : 在 该 处 插入 和 删除 都 很 方便 ， 且 不 必 设 置 头 结 点 〈 增 加 头 结 点 并 没有 什么 作用 )。 栈 
顶 指针 top 束 是 链表 的 头 指针 ， 链 栈 由 栈 项 指针 唯一 确定 ， 当 top=NULL 时 为 空 栈 。 

栈 中 的 插入 和 删除 操作 不 存在 元 素 移 动 的 问题 ， 采 用 链 式 存储 结构 ， 主 要 是 避免 顺序 
存储 中 存储 区 的 预 申请 问题 ， 或 者 说 为 了 动态 利用 存储 空间 。 链 栈 的 


示意 图 见 图 3.4。 a 栈 顶 
链 栈 的 类 型 及 变量 说 明 与 单 链 表 的 类 似 : 
typedef struct node * pointer; // 结 点 指针 类 型 | 
struct node 1 - 
datatype data; 
pointer next; | 
js // 链 栈 结 点 类 型 栈 底 
typedef struct { 
pointer top; 图 3.4 ” 链 栈 的 示意 图 
} lkstack; // 链 栈 类 型 


这 里 将 链 栈 定义 为 一 个 结构 类 型 (但 只 有 一 个 成 员 ， 即 栈 项 指针 top)， 一 方面 可 与 后 
面 将 要 介绍 的 链 队 列 在 形式 上 一 致 ， 便 于 链 栈 和 链 队 列 的 对 比 ， 另 一 方面 ， 也 可 使 链 栈 和 
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顺序 栈 有 关 算 法 的 函数 原型 基本 一 致 ， 方 便 使 用 。 

链 栈 中 的 结 点 是 动态 产生 的 ， 在 用 户 内 存 空间 范围 内 一 般 不 必 考 夸 上 溢 问 题 。 下 面 给 
出 链 栈 上 的 5 种 基本 运算 。 

1. 初始 化 


Vold init lkstack (lkstack *]1s) { 
1s—->top=NULL; 
} 


2. 判 栈 空 


int empty lkstack (lkstack *]s) { 
if (1s->top==NULL) return 1; 
else return 0; 


} 
3. 进 栈 


Vold push lkstack (lkstack *]ls,datatype x) { 
pointer p; 


p=new node; // 申 请 新 结 点 *p 
p—>data=x;; // 新 结 点 data 域 装 入 x 的 值 
p->next=1s->top; // 改 新 结 点 next 指针 ， 原 栈 项 成 为 新 结 点 的 后 继 
1s->top=p; // 改 栈 项 指针 ， 新 结 点 成 为 新 的 栈 顶 
} 
4. 退 栈 
int pop lkstack (lkstack *]ls,datatype *x) { // 栈 项 元 素 值 由 参数 返回 


pointer p; 
if (1s->top==NULL) {cout<<“ 栈 空 ， 不 能 退 栈 ! \n”;return 0;} // 下 洲 


p=1s->top; / /保存 栈 项 结 点 地 址 

*x=p—>data; // 取 出 栈 项 元 素 值 给 x 
1s->top=p->next; // 改 栈 顶 指针 ， 原 栈 顶 的 后 继 成 为 新 的 栈 顶 
delete p; / /释放 原 栈 项 元 素 空 间 


return 1; 
} 


5. 取材 项 


int gettop lkstack (lkstack *ls,datatype *x) { // 栈 顶 元 素 值 由 参数 返回 
if (1s->top==NULL) {cout<<” 栈 空 ， 无 栈 顶 可 取 ! \n”;return 0;} // 栈 空 
*x=15->top->data; // 取 出 栈 顶 元 素 值 给 x 
return 1; 

} 


上 述 链 栈 是 用 动态 链表 实现 的 ， 多 个 栈 的 空间 自然 是 共享 的 。 但 链 栈 还 可 在 静态 链表 上 
实现 ， 只 要 插入 和 删除 运算 是 在 静态 链表 的 表 头 上 进行 就 可 ， 并 且 也 可 方便 地 实现 两 个 以 上 
的 静态 链 栈 共 享 一 个 回 量 空间 ， 这 比 多 个 顺序 栈 共 享 癌 量 空 间 容 易 ， 这 里 不 详细 讨论 了 。 
3.1.4 栈 的 应 用 举例 


栈 的 应 用 非常 三 ， 只 要 问题 满足 LIFO 原则 ， 均 可 使 用 栈 做 数据 结构 ， 本 市 仅 誉 儿 例 ， 


NA 
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在 以 后 的 章节 中 还 会 经 常 借助 栈 来 解决 各 种 问题 。 

例 3.1 编写 一 个 简单 程序 ， 从 终端 上 接收 字符 并 可 进行 一 定 的 编辑 。 

解 : 假定 在 字符 接收 过 程 中 需要 以 下 功能 : 

(1) 退 格 ， 即 删除 前 面 的 一 个 字符 ， 用 字符 “# ”代表 。 

(2) 作废 ， 即 删除 前 面 的 万 有 字 符 ， 用 字符 “@” 表 示 。 

(3) 结束， 即 结束 本 次 输入 ， 用 字符 “$” 表 示 。 例 如 ， 假 设 从 键盘 上 输入 串 “You@ 
How a#are Youl$”， 则 实际 上 表示 “How are Youl ”。 

根据 题 意 ， 可 用 栈 来 实现 这 个 要 求 : 耕读 入 的 字符 是 “#”， 则 退 栈 ;， 辱 读 入 的 字符 是 
“@”， 则 退 栈 到 空 ;， 奋 读 入 的 字符 是 “$2”， 则 编辑 结束 ; 当 读 入 其 余 字 从 时 ， 则 进 栈 。 具 


体 算法 如 下 : 
sqstack sq; / /顺序 栈 sq 设 为 全 程 量 
void edit() f{ // 编 辑 好 的 字符 串 在 sg 中 


char ch,x:; 
init sqstack(&sq); / /初始 化 顺序 栈 sq 
while (cin>>ch,ch!=’$’) { // 读 入 一 个 人 字符， 者 不 是 结束 符 则 循环 
switch(ch) { 
case '#’: pop sqstack(&sq, &x) ;break; 
case '@’: while(!empty sqstack(&sq)) 
pop sqstack(&sq, &x); break; // 清 空 栈 
dcelault: push sgqstack (tsqy ch)s 
} 
} 

} 

例 3.2 设 有 A、B、C、D 四 辆 车 依次 进入 一 个 栈 式 结构 的 车 库 ， 问 从 库 中 倒 出 来 的 
车 可 不 可 能 是 A、D、B、C 的 顺序 。 

解 : 这 里 规定 了 入 库 即 进 栈 次 序 ， 并 不 意味 看 已 入 栈 的 车 中 途 不 能 出 栈 ， 也 就 是 说 进 
栈 、 出 栈 可 交替 进行 。 为 判断 出 栈 顺 序 的 可 能 性 ， 一 个 简单 的 方法 是 用 图 形 来 模拟 ， 即 先 男 
一 个 空 栈 ， 然 后 根据 进出 栈 序列 的 要 求 来 模拟 相应 的 进出 栈 过 程 。 对 目标 序列 {A, D, B, C}: 

(1) 第 一 个 出 栈 的 是 A， 这 可 通过 A 入 栈 ， 马 上 出 栈 得 到 。 

(2) 第 二 个 出 栈 的 是 D， 这 可 在 〈1) 基础 上 B 入 栈 、C 入 栈 、D 入 栈 、D 出 栈 得 到 。 

(3) 第 三 个 要 让 B 出 栈 ， 这 不 可 能 了 ， 因 为 第 〈2) 步 后 栈 内 有 B 和 C, 但 C 为 栈 项 ， 
只 有 C 出 栈 了 B 才 可 能 出 栈 。 所 以 {A,D, B, C} 不 是 可 能 的 出 栈 序 列 。 

如 宋 涉及 的 序列 元 素 较 多 ， 用 上 面 的 方法 来 模拟 束 比 较 烦琐 了 了。 实际 上 ， 这 类 问题 是 
有 规律 可 循 的 : 设 n 个 元 素 按 大 小 依次 入 栈 ， 则 在 可 能 的 出 栈 序 列 中 ， 对 任 一 元 素 k， 其 
后 面 的 元 素 或 者 都 大 于 k; 或 者 小 于 的 元 素 递 减 排列 〈 参 见习 题 3.2)。 对 本 例 {A, D, B,C}， 
D 后 和 面 比 它 小 的 {B,C} 不 是 递减 排列 , 故 不 是 可 能 的 出 栈 序列 ; 又 如 {A, C, B,D} 则 是 可 能 
的 出 栈 序列 ， 相 应 的 进出 栈 过 程 为 : A 进 一 A 出 一 B 进 一 C 进 一 C 出 一 B 出 一 D 进 一 D 出 。 

与 此 例 相 关 的 为 一 类 问题 是 ， 当 入 栈 次 序 一 定时 ， 可 能 的 出 栈 序列 有 多 少 。 显 然 ，n 
个 数据 的 排列 有 n! 种 ， 但 未 必 都 是 可 能 的 出 栈 顺 序 。 当 元 素 很 少时 可 逐个 检查 其 排列 ， 
如 3 个 元 素 {A, B, C} 的 排列 有 31! =6 种 : ABC、ACB、BAC、BCA、CAB、CBA, 检查 发 
现 CAB 不 可 能 ， 故 可 能 的 出 栈 序列 有 5 种 。 当 元 素 较 多 时 ， 了 逐个 检查 其 排列 就 不 合适 了 。 
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一 般 地 ，n 个 元 素 在 入 栈 顺 序 一 定时 ， 可 能 的 出 本 序列 数 为 一 一 C3 (参见 习题 3.2)。 


例 3.3 用 栈 实现 函数 调用 。 
解 : 考虑 如 下 程序 : 


void main() { void fl() { void f2() { 
i rl1:f2(); } 

Pie | 芝 

} } 


该 程序 有 3 个 函数 ， 它 们 之 间 存 在 如 下 调用 关系 : 主 函 数 main 在 其 函数 体内 r0 处 调 
用 函数 且 , 而 皇 又 在 其 函数 体内 rl 处 调用 函数 刀 , 人 2 不 调用 其 他 函数 。 这 样 , 当 函 数 main 
执行 到 r0 处 时 ， 要 调用 fl， 于 是 main 被 “ 挂 起 ”>，fl 开始 执行 。 只 有 当 fl 执行 完 后 ， 才 
返回 main 的 r0' 处 继续 执行 剩 下 的 部 分 。 但 函数 fl 执行 到 rl 处 时 ， 又 要 调用 刀 ， 结 果 旭 
又 被 “ 挂 起 ”一 直 等 到 锯 执行 完 后 ， 才 返回 zl 处 继续 执行 后 继 语句 。 这 三 个 函数 的 调用 
与 返回 关系 及 运行 次 序 如 图 3.3(a) 所 示 。 


main f1 f2 


I、 


(a) 多 级 函数 调用 与 返回 关系 及 运行 次 序 


topp 一 “| 六 
top 一 *| ro 0 | top 一 "Lo 


top 一 top 一 一 
调用 f1 前 调用 f1 后 调用 他 后 返回 f1 后 返回 main 后 
(b) 工作 栈 状 态 变 化 示意 图 


图 3.5 函数 的 调用 与 返回 次 序 及 相应 工作 栈 状 态 变化 示例 


以 主 调 函 数 main 为 例 ， 在 被 调用 函数 自 执行 完 后 ， 需 要 回 到 原 调用 语句 的 下 一 条 语 
句 处 r0' 才 能 继续 执行 后 面 的 语句 。 这 就 需要 在 调用 转移 前 保存 返回 地 址 r0'。 在 多 级 调用 
中 ， 丈 要 保存 多 个 返回 地 址 ， 这 样 ， 当 茶 个 调用 要 返回 时 ， 应 该 返回 到 哪个 地 址 呢 ? 从 图 
3.5 (a) 不 难看 到 ， 在 多 级 调用 时 ， 应 该 返回 到 最 后 保存 的 地 址 。 比 如 调用 从 亿 返回 时 ， 
己 保存 的 返回 地 址 有 两 个 : r0 和 Tl ， 正 确 的 是 返回 到 zl ， 即 应 取出 地 址 r1'"， 而 它 是 后 保 
存 的 。 这 样 ， 后 保存 的 地 址 先 返 回 ， 先 保存 的 地 址 后 返回 ， 正 好 可 用 栈 来 完成 。 

实际 上 ， 用 栈 来 实现 函数 的 调用 与 返回 机 制 ， 仅 在 用 低级 语言 如 汇编 语言 编程 时 才 会 
考 夸 ; 当 用 局 级 语言 编程 时 ， 有 关 的 控制 工作 由 编 详 系 统 目 动 完成 了 ， 用 户 不 需 考 虑 。 所 
用 的 栈 称 为 工作 栈 。 每 次 函数 调用 时 ， 将 返回 地 址 、 参 数 入 栈 ;， 为 外 ， 局 部 变量 、 返 回 值 
等 也 在 栈 中 分 配 空 间 ， 所 有 这 些 信 息 共 同 构成 一 个 栈 顶 元 素 ， 相 当 于 当前 工作 环境 《和 称 
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活动 记录 )。 栈 在 函数 的 调用 和 返回 中 ,相当 于 按 后 进 先 出 的 原则 切换 工作 环境 〈 并 传递 信 
上 县)。 上 面 的 三 个 函数 执行 时 ， 工 作 栈 状态 变化 示意 岁 如 图 3.3 (b) 所 示 。 

例 3.4 用 栈 实现 递归 函数 。 

解 : 递归 是 一 个 重要 的 概念 ， 它 可 用 于 描述 事物 ， 也 是 一 种 重要 的 程序 设计 方法 。 简 
单 地 说 ， 如 果 在 一 个 函数 或 数据 结构 的 定义 中 直接 或 间接 地 应 用 了 其 目 喘 (作为 定义 项 之 
一 ), 则 这 个 函数 或 数据 结构 就 称 为 递归 定义 的 , 简称 递归 的 。 递归 函数 也 称 为 自 调 用 函数 。 

例如 ， 阶 乘 函 数 可 递归 定义 如 下 : 


] n=0 
nl!= 
| n>0 
由 该 定义 很 容易 写 出 相应 的 递归 算法 : 
long f(int n) { 
1if (n==0) return 1; 


else return n*f (nl1);} 
} 


递归 函数 的 运行 引起 递归 调用 。 例 如 ， 对 上 面 求 阶乘 的 函数 ， 以 n=3 为 例 ，f3) 的 执 
行 中 出 现 的 递归 调用 和 返回 过 程 如 图 3.6 (a) 所 示 。 显 然 ， 递 归 调 用 和 返回 的 控制 与 非 递 归 
函数 并 无 本 质 区 别 〈 只 是 每 次 调用 的 是 其 自己 而 已 )， 同 样 由 一 个 工作 栈 来 实现 。 图 3.6 (b) 
所 示 为 与 图 3.6(a) 相应 的 工作 栈 状 态 变 化 过 程 〈 栈 中 除了 返回 地 址 外 ， 还 有 参数 、 局 部 
变量 、 返 回 值 等 其 他 信息 )。 


f(3) f(2) f(1) f(0) 


A 


top ey 
加 2 加 图 
top 
一 -一 


调用 f(2) 前 调用 f(2) 后 调用 f(1) 后 调用 f(0) 后 返回 f(1) 后 返回 f(2) 后 ”返回 f(3) 后 
(b) 工作 栈 状 态 变化 示意 图 


3.6 ”递归 函数 的 调用 与 返回 次 序 及 相应 工作 栈 状态 变化 示例 


天 于 递归 ， 要 特别 注意 ， 递 归 定 义 不 是 “循环 定义 ”， 它 必须 满足 两 个 条 件 : 

(1) 递归 过 程 中 每 一 次 应 用 自己 时 ， 对 应 的 “尺度 ”要 比 当 前 小 。 

(2) 至少 存 在 一 个 最 小 的 “尺度 ”， 该 处 的 定义 不 是 递归 的 ， 从 而 结束 递归 。 

例如 ， 上 面 在 定义 阶乘 n! 时 应 用 了 阶乘 (no-1)!， 后 者 的 “尺度 ”n-1 比 当前 的 “尺度 ” 
nn 小。 另外 ， 阶 乘 nl 在 最 小 “尺度 ” 即 0 上 的 定义 不 是 递归 的 ， 直 接 定 义 为 1。 

上 述 两 个 条 件 实 际 上 构成 了 递归 程序 设计 的 基本 原则 。 在 相应 的 递归 程序 中 ， 与 上 面 
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(1) 对 应 的 部 分 一 般 称 作 递归 体 (或 称 递归 项 ), 与 (2) 对 应 的 部 分 一 般 称 作 递归 出 口 〈 或 
称 终止 项 )， 即 递归 过 程 的 终止 条 件 ， 通 币 与 在 递归 函数 的 开头 。 

递归 是 程序 设计 中 的 一 个 强 有 力 的 工具 。 这 是 因为 : 

其 一 ， 很 多 实际 问题 本 喘 就 是 递归 定义 的 ， 这 时 用 递归 来 实现 相应 的 算法 既 容 易 又 自 
然 ， 如 上 面 阶乘 的 计算 、 本 书后 和 面 将 介绍 的 图 的 深度 优先 遍历 等 。 

其 二 ， 有 的 数据 结构 本 喘 就 有 递归 特性 ， 如 以 后 将 介绍 的 二 叉 树 、 广 义 表 等 ， 这 时 对 
它们 的 运算 用 递归 描述 很 方便 ， 而 相应 的 算法 用 递归 实现 也 很 方便 。 

其 三 ， 有 些 问 题 虽然 没有 明显 的 递归 特性 ， 但 可 很 容易 地 分 解 (Divide〉 出 帮 干 类 似 
的 子 问题 ， 分 别 求解 〈Conquer) 后 将 结果 组 合 (Combine )， 就 得 原 问题 的 解 。 这 就 是 所 
谓 的 “分 治 法 ”(Divide and Conquer)， 这 类 算法 用 递归 实现 比较 容易 ， 如 本 书后 面 将 介绍 
的 快速 排序 、 归 并 排序 等 ,特别 地 , 有 些 问 题 如 果 不 用 递归 求解 将 非常 困难 , 如 著名 的 Hanoi 


季 问 题 。 


8.2 队列 


3.2.1 ”队列 的 概念 及 运算 


队列 Queue) 也 是 一 种 运算 受 限 的 线性 表 。 它 只 人 允许 在 表 的 一 痛 进 行 插 入 ， 而 在 另 
一 站 进行 删除 。 人 允许 删除 的 一 关 称 为 队 头 〈EFront)， 人 允许 插入 的 一 关 称 为 队 尾 (Rear)。 插 
入 与 删除 分 别称 为 入 队 与 出 队 。 

队列 的 特点 同 现实 生活 中 购物 排队 过 程 类 似 : 新 来 的 成 员 总 是 加 入 到 队 尾 不 允许 中 
间 插 队 )， 每 次 离开 的 成 员 总 是 队 头 《不 允许 中 途 离 队 )， 即 当前 “最 老 的 ”成 员 离队 。 换 
言 之 ， 先 进入 队列 的 成 员 总 是 先 离开 队列 ， 后 进入 队列 的 成 员 总 是 后 离开 队列 。 因 此 队列 
处 称 作 先进 先 出 〈FIFO，First In First Out) 或 后 进 后 出 (LILO，Last In Last Out) 的 线性 
表 。 队 列 中 的 元 素 出 队 次 序 与 进 队 次 序 相同 。 

当 队 列 中 没有 任何 元 素 时 称 为 空 队列 。 在 空 队 列 中 ER 
依次 加 入 元 素 a1, aa，…, aa 之 后 ，ai 是 队 头 元 素 ，aa 是 队 8 aaa … an “入 队 


尾 元 素 。 显 然 退 出 队列 的 次 序 也 只 能 是 a1, az，…, an， 也 | | 
就 是 说 队列 的 修改 是 按 先进 先 出 的 原则 进行 的 。 图 3.7 是 WS 队 尾 
队列 的 示意 网 。 图 3.7 队列 示意 图 


队列 的 基本 运算 有 以 下 5 种 : 

(1) 初始 化 INITIATE(Q)。 加 工 型 运算 ， 设 置 一 个 空 队列 。 

(2) 判 队 空 EMPTY(Q)。 引 用 型 运算 ， 寿 Q 为 定 ， 则 返回 1， 人 否则 返回 0。 

(3) 入 队 ENQUEUE(Q, x)。 加 工 型 运算 ， 将 元 素 x 插入 队列 Q 的 尾部 。 

(4) 出 队 DEQUEUE(Q)。 加 工 型 运算 ， 将 队 头 元 素 删除 ， 并 返回 该 元 素 。 

(5) 读 队 头 GETHEAD(Q)。 引 用 型 运算 ， 取 队 头 元 素 ， 但 不 删除 它 。 

根据 需要 ， 还 可 增加 判 队 满 FULL(Q) 的 运算 。 以 上 运算 (3) 一 05) ， 对 特殊 情况 (如 
队列 空 时 ) ， 需 要 特殊 处 理 ， 如 返回 特殊 标志 等 。 
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由 于 队列 是 运算 受 限 的 线性 表 ， 因 此 线性 表 的 存储 结构 对 队列 也 适用 ， 即 一 般 采 用 顺 
序 存储 和 链 式 存储 结构 。 队 头 和 队 尾 位 置 随 看 出 队 和 入 队 操 作 而 变化 ， 故 一 般 需 要 两 个 变 
量 front 和 rear 来 指示 它们 的 当前 位 置 。 通 第 称 front 为 队 头 指针 ，rear 为 队 尾 指针 。 


3.2.2 ”队列 的 顺序 实现 


队列 的 顺序 存储 结构 称 为 顺序 队列 。 顺 序 队 列 实际 上 是 运算 受 限 的 顺序 表 ， 它 用 一 个 
回 量 空间 来 存放 当前 队列 中 的 元 素 。 队 头 指 针 和 队 尾 指针 分 别 指出 当前 队 头 元 素 和 队 尾 元 
素 在 问 量 空间 中 的 位 置 。 顺 序 队 列 的 类 型 说 明 如 下 : 


const int maxsize=100; // 队 列 的 容量 ， 元 素 最 多 不 能 超过 它 
typedef struct { 

datatype data[maxsizel]; 

int front, rear; 


} sqqueue; / /顺序 队列 类 型 

通常 将 尾 指针 rear 指 问 当前 队 尾 元 素 的 真正 位 置 ， 而 头 指针 front 指 问 当前 队 头 元 素 
的 前 一 个 位 置 ”〈 不 让 头 、 尾 指针 都 指向 真正 位 置 是 为 了 某 些 运算 的 方便 ， 但 不 是 唯一 的 
方法 )。 刚 开始 时 ， 队 列 的 站、 尾 指针 都 指 问 问 量 空间 下 界 的 前 一 个 位 置 ， 在 此 设 为 -1。 
以 后 在 出 队 或 入 队 时 ， 头 指针 或 尾 指 针 值 递增 变化 。 图 3.8 说 明了 在 顺序 队列 中 进行 入 队 
和 出 队 运 算 时 队列 中 的 元 素 及 其 头 尾 指针 的 变化 情况 。 注 意 ， 与 顺序 栈 类 似 ， 出 队 后 的 元 
素 并 没有 真正 控 去 ， 但 已 不 起 作用 。 


号 号 
4 4 
3 3 二 一: 国 
2 这 
1 1 
0 ro — of A- 
front 二 -1 front 一 > 
(a) 空 队列 (b) A 入 队  (c) B、C、D 相继 (d) B、C、D 相继 (e) E、F 相继 入 
入 队 ，A 出 队 出 队 ， 队 衬 假 满 


图 3.8 顺序 队列 运算 时 的 头 、 尾 指针 变化 情况 


与 顺序 表 类 似 ， 顺 序 队 列 也 可 从 数组 下 标 1 开始 使 用 ， 数 组 大 小 定义 为 data 
[maxsize+1]，data[0] 不 用 。 这 时 队列 开始 时 ， 队 列 的 头 、 尾 指针 设 为 0。 

显然 ， 当 前 队列 中 的 元 素 个 数 〈( 即 队列 的 长 度 ) 是 rear-front。 奋 rear=front， 则 队列 
长 度 为 0， 即 当前 队列 是 空 队列 ， 如 图 3.8(a) 和 图 3.8(d) 均 表示 衬 队 列 。 队 列 为 空 时 册 做 出 
队 操 作 便 会 产生 “下 洲 ?”。 队 满 的 条 件 是 当前 队列 长 度 等 于 癌 量 空间 的 大 小 ， 即 
rear—front—maxsize 。 队 满 时 再 做 入 队 操作 会 产生 “上 深 ” 

但 是 ， 有 一 种 情况 ， 见 图 3.8e)， 队 列 并 不 满 ， 但 尾 指 针 已 到 数组 的 上 办 
(rear=maxsize 一 1)， 也 不 能 入 队 了 ， 因 为 再 入 队 就 会 洲 出 到 数组 空间 外 。 这 种 现象 称 为 “ 假 


G 或 将 尾 指针 rear 指 问 当前 队 尾 元 素 的 后 一 个 位 置 ， 而 头 指 针 front 指 回 当前 队 头 元 素 的 真正 位 置 ， 
相应 地 ， 队 列 运算 的 有 关 实 现 需 略 作 调整 。 


第 3 章 栈 、 队 列 和 串 9 


上 洪 ” 或 “ 假 溢 出 ?。 显 然 , 如 果 中 途 有 出 队 ， 则 入 队 maxsize 次 后 再 入 队 ， 必 定 会 假 上 洲 。 
产生 这 种 现象 的 原因 是 ， 队 尾 总 在 队 头 的 后 部 ， 随 看 出 、 入 队 的 进行 ， 队 列 整 体 上 癌 后 移 
动 ， 己 出 队 的 原 队 头 空间 不 能 再 使 用 ， 形 成 浪费 。 为 克服 这 一 缺点 ， 可 以 在 每 次 出 队 时 将 
整个 队列 癌 前 移动 一 个 位 置 ， 或 者 在 发 生 假 洲 出 时 ， 将 整个 队列 一 次 性 地 移动 到 数组 的 开 
始 处 。 显 然 ， 这 两 种 方法 都 会 引起 大 量 元 素 的 移动 ， 效 果 不 好 。 

通常 采取 的 方法 是 : 设想 问 量 data[maxsize] 是 一 个 首尾 相 接 的 圆 环 ， 即 data[0] 接 在 
data[maxsize 一 1] 之 后 。 我 们 将 这 种 意义 下 的 问 量 称 为 循环 向 量 ， 并 将 循环 问 量 中 的 队列 称 
为 循环 队列 (Circular Queue)， 如 图 3.9 所 示 。 这 时 ， 奋 当前 尾 指针 等 于 癌 量 的 上 界 ， 则 册 
做 入 队 操 作 时 ， 令 尾 指针 折 回 到 回 量 的 下 界 ， 这 样 就 能 重复 利用 已 被 删除 的 元 素 空 间 了 ， 
从 而 元 服 了 假 上 洲 。 


2 Bs 


tion A SN 
人 


0 maxsize—1 0 maxsize—1 


(a) 一 般 情 况 (b) 队 空 
图 3.9 循环 队列 示意 图 


在 循环 队列 中 做 入 队 操作 时 ， 尾 指针 的 变化 为 : 


rear=reart+l;1f (rear=——maxs1ize) rear=0; 


如 果 利 用 “ 模 运 算 ”， 上 述 语句 可 简洁 地 表示 为 : 


rear= (rear+l) Smaxsize; 


同样， 在 循环 队列 中 做 出 队 操 作 时 ， 头 指针 的 变化 为 : 


front= (front+l1) $maxsize; 


为 了 称呼 方便 ， 以 上 头 、 尾 指针 的 变化 人 简称 为 循环 意义 下 的 加 1。 

在 循环 队列 中 ， 队 尾 就 不 一 定 总 在 队 头 的 后 面 了 : 随 看 入 队 的 进行 ， 它 可 能 从 数组 的 
高 关 折 回 到 数组 的 低 问 ， 从 而 位 于 队 头 的 前 面 。 这 样 ， 入 队 过 程 中 尾 指针 如 可 能 赶 上 头 指 
针 ， 即 rear=front， 此 时 队 满 。 同样 ， 出 队 过 程 中 , 头 指针 也 可 能 赶 上 尾 指针 ， 即 rear=front， 
此 时 队 空 。 于 是 ， 仅 赁 等 式 front=rear 就 无 法 区 分 循环 队列 是 空 还 是 满 。 

对 此 ， 一 般 有 以 下 儿 种 解决 方法 : 

(1) 设置 长 度 计 数 器 n， 入 队 时 nmn 加 1， 出 队 时 nm 减 1， 如 果 n 为 0 则 队 空 ， 如 果 m 为 
maxsize 则 队 满 。 

(2) 设置 标志 位 Bag， 比 如 ， 奋 入 队 后 出 现 rear=front， 则 置 flag=1， 其 他 情况 flag=0。 
于 是 队 满 条 件 为 Hag=1， 队 空 条 件 为 rear=front 且 flag=0。 

(3) 衬 置 一 单元 法 : 当 循 环 同 量 中 只 剩 一 个 元 素 空间 ， 即 有 maxsize 个 分 量 的 循环 问 
量 已 存放 maxsize-] 个 元 素 时 ， 束 认为 队列 已 满 。 这 时 ， 尾 指针 在 循环 意义 下 加 1 后 等 于 
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头 指 针 ， 即 队 满 的 条 件 是 : 


(ear 十 1) Smaxsize=front 


这 样 , rear=front 怠 只 是 队 衬 的 条 件 。 队 满 时 的 空 单元 就 是 front 所 指 单元 (实际 上 front 

显然 ， 前 两 种 方法 会 增加 出 、 入 队 的 时 间 开 销 ( 且 需 增加 一 个 辅助 空间 )。 本 节 采 用 
的 是 最 后 一 种 方法 。 

和 栈 类 似 ， 在 程序 中 使 用 的 队列 ， 其 初 态 和 终 态 均 可 为 空 ， 因 此 队 空 也 可 作为 程序 转 
移 的 逻辑 条 件 ， 而 队 满 一 般 是 一 个 错误 状态 ， 应 设法 避免 。 

在 循环 队列 上 实现 的 5 种 基本 运算 如 下 : 


1. 初始 化 
Vold init sqqueue (sqqueue *sq) { 
sq->front=sq->rear=0; / /不 能 为 -1 


} 


注意 , 循环 队列 头 、 尾 指针 的 初 值 不 能 设 为 -1, 但 可 设 为 0 一 maxsize-1 之 间 的 任何 值 ， 
因为 队列 空间 是 循环 利用 的 ， 可 从 其 中 任 一 位 置 开始 使 用 。 
2. 判 队 空 


int empty sqqueue (sqqueue *sq) { 
1f (sq—->rear==sq->front) return 1; 
else return 0; 

} 


3， 取 队 头 
Int gethead sqqueue (sqqueue *sq,datatype *x) { // 队 头 元 素 值 由 参数 返回 


if (sq->rear==sq->front) {cout<<” 队 衬 ， 无 队 头 可 取 ! \n”;return 0;} 
k#X=Sd->data[ (sq->front+1)%maxsize]; // 头 指针 的 下 一 个 位 置 才 是 队 头 
return 1; 

} 


4. 入 队 


int en sqqueue (sqqueue *sq,datatype x) { 
1if((sq->rear+l)%maxsize==sq->front) 
{cout<<” 队 满 ， 不 能 入 队 ! \n”;return 0;}// 队 满 上 洲 
sq—>rear= (sq->rear+l1)%maxsize; 
sq—>datal[lsq-—>rearl]=x; 
return 1; 


} 
5. 出 队 


int de sqqueue (sqqueue *sqg,datatype *x) { // 队 头 元 素 值 由 参数 返回 
if (sq->rear==sq->front) {cout<<“ 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 空 下 洲 
sq—>front=(sq->front+1)%maxsize; 
*x=Ssq—>datalsq->front]; 
return 1; 
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3.2.3 ”队列 的 链接 实现 


队列 的 链 式 存储 结构 称 为 链 队 列 , 它 是 限制 仅 在 表 头 删除 和 表 尾 插入 的 单 链表 。 显然 ， 
采用 尾 插 法 的 单 链表 比较 合适 。 单 链表 由 头 指 针 唯 一 确定 ， 本 来 不 需要 尾 指针 ， 但 链 队 列 
经 第 要 在 尾部 进行 插入 操作 ， 增 加 尾 指 针 后 运算 比较 方便 (但 硅 采 用 尾 指 针 表 示 的 循环 链 
表 来 表示 队列 ， 则 可 不 需要 队 头 指针 )。 

与 链 栈 一 样 ， 队 列 中 插入 和 删除 操作 不 存在 元 素 移 动 问题 ， 采 用 链 式 存储 结构 ， 主 要 
是 避免 顺序 存储 中 存储 区 的 预 申 请 ， 或 者 说 为 了 动态 利用 存储 空间 。 


和 单 链表 一 样 ， 为 了 运算 方便 ， 可 采用 头 结 点 ， 这 时 头 指针 指 问 头 结 点 。 链 队列 的 示 
意图 见 图 3.10。 当 链 队 列 为 空 时 ， 头 指针 和 尾 指针 均 指 癌 头 结 点 。 
头 结 点 队 头 队 尾 头 结 扩 
[一 LI 天 
front Ls front 1， 
(a) 非 空 链 队 (b) 衬 链 队 


图 3.10 链 队 列 示 意图 


链 队 列 的 类 型 定义 如 下 : 
typedef struct node * pointer; // 结 点 指针 类 型 
struct node { // 链 队列 结 点 结构 


datatype data; 
pointer next; 
}; 
typedef struct 1{ 
pointer front, rear; 


} lkqueue; // 链 队列 类 型 
下 面 给 出 链 队 列 的 $ 种 基本 运算 。 
1. 初始 化 


Vold init lkqueue (lkqueue #1dq) { 
pointer p; 


p=new node; // 申 请 头 结 点 空间 
p->next=NULIL:; // 头 结 点 next 指针 为 衬 


1q->front=1q->rear=p; // 头 指针 、 尾 指针 都 指 回 头绪 点 
} 


2. 判 队 空 


int empty lkqueue (lkqueue +*]1q) { 
if (1q->rear==1q->front) return 1; 
else return 0; 

} 


3.， 取 队 头 


int gethead lkqueue (lkqueue *#1ldqvdatatype *x) { // 队 头 元 素 值 由 参数 返回 
pointer p; 
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if (1q->rear==1q->front) {cout<<“ 队 空 ， 无 队 头 可 取 ! \n”;return 0;} 
p=l1q->front->next; // 队 头 
*x=p->data; // 取 出 队 头 元 系 什 


relurn > 


} 
4. 入 队 


Vold en lkqueue (lkqueue *lq,datatype x) { 


pointer p; 


p=new node; // 申 请 新 结 点 空间 
p->data=x; // 给 新 结 点 赋值 
1q->rear->next=p; // 原 尾 指 针 指 问 新 结 点 
1gq->rear=p; // 新 结 点 成 为 新 尾 结 点 
p—>next=NULL; // 新 尾 结 点 next 指针 为 空 
} 
5. 出 队 


耕 当 前 链 队 列 的 长 度 大 于 1， 则 出 队 时 只 须 修改 头 指针 的 next 域 ， 尾 指针 不 变 ， 见 图 


3.11; 


但 当 链 队列 的 长 度 为 1 时 ， 出 队 后 将 成 为 空 队 列 ， 这 时 除 修 改 头 指针 外 ， 还 要 修改 


尾 指 针 ， 使 它 指 问 头 结 点 ， 见 图 3.12。 


队 头 
头 结 点 。 队 尾 头 结 点 
头 结 点 ,” 队 头 “、、 队 尾 表 才 [al 了 下 
E 殉 了 [村 -La 村 一 [LT | 
front s rear front rear 
front S rear (a) 出 队 前 (b) 出 队 后 
图 3.11 队列 长 度 大 于 1 时 出 队 运 算 示 意图 图 3.12 队列 长 度 为 1 时 出 队 运算 示意 图 
出 队 算法 如 下 : 
Int de lkqueue (lkqueue *]lqg,datatype *x) { // 队 头 元 素 值 由 参数 返回 


} 


pointer s; 

if (1q->rear==1q9->front) {cout<<“ 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 衬 下 洲 
s=]q->front->next; /Vs 指 问 原 队 头 

*x=Ss—>data; 

lq->front—>next=s-—>next; 

if (s->next==NULL) 1q9->rear=1q->front;y// 仅 剩 一 个 结 点 时 出 队 后 要 改 尾 指针 
delete 5s; 

return 1; 


算法 中 每 次 出 队 时 部 要 判断 是 否 为 最 后 一 个 结 点 出 队 ， 而 一 般 情 况 下 队列 部 不 是 仅 剩 
最 后 一 个 结 点 ， 所 以 大 多 时 候 这 种 判断 是 多 余 的 ， 效 率 不 局 。 

为 此 可 采用 一 种 改进 的 等 效 出 队 算法 。 即 出 队 时 , 删除 头 结 点 〈 注 意 , 不 是 队 头绪 点)》， 
使 链 队 列 的 原 队 头 结 点 成 为 新 的 头 结 点 ， 队 列 的 原 第 2 个 结 点 成 为 新 的 队 头 结 点 。 这 样 ， 
物理 上 删除 的 是 头 结 点 ， 旬 辑 上 删除 的 是 队 头 结 点 。 于 是 ， 不 论 当 前 队列 长 度 是 否 为 1， 
出 队 时 也 只 修改 头 指针 ， 而 不 用 修改 尾 指针 。 指 针 变 化 情况 见 图 3.13。 
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头 结 点 队 头 队 尾 
s ra rear 


图 3.13 ”等 效 出 队 运算 示意 图 
改进 后 的 出 队 算法 如 下 : 


int de lkqueue2 (lkqueue *]lq,datatype *x) { // 队 头 元 素 值 由 参数 返回 
pointer s; 
if (1q->rear==1q->front) {cout<<” 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 空 下 洲 
s=1q-—>front; /Vs 指 回 头 结 点 
*x=s—>next->data; // 取 出 原 队 头 数据 
lq->front=s->next; // 头 指针 指 回 原 队 头 
delete s; // 释 放 尿 头 结 点 
return 1; 


} 


一 般 而 言 ， 具 有 FIFO 特性 的 问题 均 可 利用 队列 作为 数据 结构 。 例 如 ， 在 网 络 中 如 果 
有 多 个 计算 机 都 需要 通过 相同 的 网 络 打 印 机 输出 结果 ,那么 就 可 以 按 请 求 输出 的 先后 次 序 ， 
将 这 些 作业 排 成 一 个 队列 ， 这 束 是 通常 所 说 的 打印 队列 ， 几 是 申请 输出 的 作业 都 从 队 尾 进 
入 队列 ， 每 次 打印 的 是 队 头 ， 打 印 完 后 出 队 。 

在 本 书 的 树 、 图 等 章节 中 ， 有 些 问 题 如 树 的 层 序 壳 历 、 图 的 广度 优先 遍历 等 就 是 用 队 
列 来 实现 的 ， 所 以 这 里 我 们 就 不 单独 列举 队列 应 用 的 例子 了 。 

最 后 需要 指出 的 是 , 还 有 2 种 队列 : 优先 队列 (Priority Queue)， 其 规则 不 是 先进 先 出 ， 
而 是 优先 级 最 高 者 先 出 ; 双 端 队列 (Double-ended Queue)， 两 端 都 可 进出 (但 中 间 位 置 仍 
不 能 插入 和 删除 )， 它 可 统一 队列 和 栈 ， 并 可 有 更 多 变化 ， 即 限制 两 端的 这 4 种 操作 的 奋 干 
个 ， 可 分 别 得 到 队列 、 单 栈 、 栈 辰 相 接 的 双 栈 、 输 出 受 限 的 双 端 队列 、 输 入 受 限 的 双 冰 队 
列 等 。 虽 然 比 较 灵 活 ， 但 实际 应 用 并 不 多 。 


6Es 中 


3.3.1 串 的 基本 概念 


串 〈String) 是 去 个 或 多 个 字符 组 成 的 有 限 序 列 。 一 般 记 为 S=“alaz…an”(Cn=0)， 其 
中 S 是 串 名 ， 双 引号 括 起 来 的 字符 序列 是 串 值 ; ai (1<i<n) 可 以 是 字母 、 数 字 或 其 他 字 
符 ; 串 中 所 包含 的 字符 个 数 称 为 该 串 的 长 度 。 长 度 为 零 的 串 称 为 空 串 ， 它 不 包含 任何 字符 。 
可 见 ， 串 是 元 素 类 型 受 限 的 线性 表 。 

将 串 值 括 起 来 的 双 引 号 是 串 的 定 界 符 ， 它 不 属于 串 的 内 容 ， 其 作用 是 避免 串 与 常数 或 
标识 符 混 消 。 例 如 ,“123” 是 数字 字符 串 ， 它 不 同 于 整 音 数 123， 又 如 “xl1” 是 长 度 为 2 
的 字符 串 ， 而 xl 通常 表示 一 个 标识 符 。 

串 中 学 符 的 取 值 范围 取决 于 所 用 的 字符 集 , 如 ASCII 字符 集 、GBK2K 字符 集 、Unicode 
字符 集 等 ， 随 编码 方案 和 字符 的 不 同 ， 每 个 字符 所 占用 的 空间 可 能 是 1 字 节 到 4 字 节 。 


SN 
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在 很 多 应 用 中 , 空格 字符 通 币 是 字符 集合 中 的 一 个 元 素 , 因此 它 可 以 出 现在 字符 串 中 ， 
打印 出 来 是 一 个 空 日 ， 有 时 为 了 清楚 起 见 ， 用 来 表示 它 。 由 一 个 或 多 个 空格 组 成 的 串 称 
为 空格 串 。 因 此 “” 和 “ ”是 不 同 的 串 ， 前 者 是 长 度 为 1 的 非 空 串 ， 它 含有 一 个 空格 字 
人 符 ， 后 者 是 长 度 为 去 的 空 串 。 

串 中 任意 个 连续 的 字符 组 成 的 子 序 列 称 为 该 串 的 子 串 ， 该 串 相 应 地 称 为 主 串 。 串 中 茶 
字符 在 串 中 出 现时 的 序号 《从 1 开始 ) 称 为 该 字符 在 串 中 的 位 置 ; 子 串 在 主 串 中 第 一 次 出 
现时 ， 子 串 的 第 一 个 字符 在 主 串 中 的 序号 ， 称 为 该 子 串 在 主 串 中 的 位 置 。 特 别 地 ， 空 串 是 
任何 串 的 子 串 , 任何 串 是 其 目 身 的 子 串 。 易 知 , 在 串 长 度 为 n, 则 其 子 串 个 数 为 n(n+1)/2+1。 

例如 ， 有 两 个 串 A 和 了 B: 

A=“HowLudo_uyou__ do 

B=“do” 

显然 了 B 是 A 的 子囊 。B 在 A 中 出 现 了 两 次 , 但 B 在 A 中 的 序号 是 $S〈 首 次 出 现 的 位 置 )。 

如 末 两 个 串 的 长 度 相 同 ， 并 且 各 个 对 应 位 置 上 的 字符 也 相同 ， 则 称 这 两 个 串 相 等 。 

通常 在 程序 中 使 用 的 串 可 分 为 两 种 ， 串 变量 和 串 常 量 。 串 常量 和 整 型 常数 、 实 型 弟 数 
一 样 ， 在 程序 中 只 能 被 引用 而 不 能 改变 它们 的 值 ， 一 般 用 直接 量 来 表示 。 串 变量 和 其 他 类 
型 的 变量 一 样 ， 其 值 是 可 以 改变 的 ， 它 必须 用 名 字 来 识别 。 

早期 的 程序 设计 语言 只 有 串 常量 的 概念 ， 串 仅 在 输入 或 输出 中 以 直接 量 的 形式 出 现 ， 
并 不 参与 运算 。 随 看 计算 机 的 发 展 ， 串 在 文字 编辑 、 符 号 处 理 及 定理 证 明 等 许多 领域 得 到 
越 来 越 广泛 的 应 用 ， 这 时 需要 将 串 作 为 一 种 变量 ， 并 参与 一 系列 的 运算 。 于 是 越 来 越 多 的 
高 级 语言 引入 了 串 变量 的 概念 , 并 建立 了 一 组 串 运 算 的 基本 函数 ,具有 较 强 的 串 处 理 功能 ， 
C/C++ 语 言 更 是 如 此 。 但 要 注意 ，C/C++ 语 言 并 没有 串 变 量 类 型 ， 串 变量 是 用 字符 数组 或 字 
符 指 针 来 间接 表示 的 ， 如 : 


char name[]=”John” ,*p=”Tom”; 


其 中 ， 和 字符 数组 的 内 容 可 以 改变 (从 而 起 到 “变量 ”的 作用 )， 但 数组 名 本 和 喘 是 常 指 
针 ， 不 是 变量 ， 不 能 像 其 他 变量 一 样 对 它 进行 赋值 ， 比 如 ， 数 组 初始 化 后 如 想 通 过 赋值 语 
人 “name=”Smith”; ”来 修改 name 的 值 是 错误 的 〈 除 非 对 “=” 进 行 重 载 ， 如 C++ 等 )。 


3.3.2 ” 串 的 基本 运算 


串 是 一 种 特殊 的 线性 表 ， 这 种 “特殊 ”不 仅 在 于 元 素 类 型 为 字 待 ， 还 在 于 其 运算 一 般 
不 是 以 “单个 元 素 ” 即 字符 为 操作 对 象 ， 而 是 以 “整体 ” 即 串 为 操作 对 象 ， 如 在 串 中 查找 
某 个 子 串 、 在 串 的 某 个 位 置 上 插入 或 删除 一 个 子 串 等 。 具 体 来 说 ， 串 的 基本 运算 有 9 种 。 
为 扳 述 方便 ， 本 节 我 们 假设 用 大 写字 母 S、T 等 表示 串 (常量 或 变量 )。 

(1) 赋值 ASSIGN(S, T): 加 工 型 运算 ， 其 作用 是 将 串 工 的 值 传 给 串 S。C/C++ 语 言 对 
应 的 是 串 拷 贝 函 数 sttcpy， 如 strcpy(S, T)。 

(2) 联接 CONCAT(S, T) 或 CONCAT(S, T, V): 其 作用 是 由 S 和 T 连 接 成 一 个 新 串 ， 其 
中 工 对 应 的 串 值 紧 接 看 放 在 S 的 后 面 。 前 者 为 加 工 型 运算 ， 新 串 存 放 在 原来 $ 的 位 置 上 ; 
后 者 为 引用 型 运算 ,新 串 存 放 在 V 中 。C/C++ 语 言 对 应 的 是 串联 接 函 数 strcat, 如 strcat(S, T)。 
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例如 : 


CONCAT ("Th", "is")="This" 


(3) 求 串 长 LENGTH(S): 引用 型 运算 ， 运算 结果 是 串 S 的 长 度 。C/C++ 语 言 对 应 的 是 
串 长 函数 strlen， 如 strlen(S)。 

(4) 求 子 串 SUBSTR(S, i, ])): 引用 型 运算 ， 运 算 结 果 是 串 S$ 中 第 1 个 字符 开始 连续 ] 
个 字符 组 成 的 子 串 。 其 中 参数 应 满足 :1<i<LENGTH(S)，0<]j。 例 如 : 

SUBSTR ("who", 2, 2)="ho", 

SUBSTR ("this"™, 3, 0)="", 

SUBSTR ("there", 4, 5)="re" 

其 中 ， 最 后 一 例 从 原 串 中 第 4 个 位 置 开始 没有 5 个 字符 可 取 ， 则 取 到 串 尾 结 束 ， 这 时 
该 子 串 共有 LENGTH-i+t 个 字符 。 

(5) 串 比 较 COMPARE(S, T) 或 判 等 EQUAL(S, T): 引用 型 运算 ， 前 者 是 比较 两 个 串 S 
和 T 的 大 小 ， 运 算 结 果 小 于 、 等 于 或 大 于 0， 分 别 表示 S<T、S=T 和 S>T。 后 者 比较 两 个 
串 S 和 T 是否 相等 ,结果 为 1( 相 等 ) 或 0( 不 相等 )。C/C++ 语 言 对 应 的 是 串 比较 函数 stremp， 
如 strcmp(S, T)。 

串 的 大 小 通 音 是 按 字 典 序 定义 的 , 即 从 两 个 串 的 第 1 个 字符 起 , 逐个 比较 相应 的 字符 ， 
直到 找到 两 个 不 等 的 字符 为 止 ， 由 这 两 个 不 等 的 字符 来 确定 串 的 大 小 。 例 如 ,“this”> 
“there”， 这 是 因为 “i”>“e”。 特 找 不 到 两 个 不 等 的 字符 ， 就 必须 由 串 长 来 决定 大 小 。 例 
如 “there”>“the”， 这 是 因为 两 个 串 的 前 三 个 字符 均一 一 相同 ， 但 前 者 长 度 大 于 后 者 。 

这 里 字符 的 大 小 由 该 字符 在 字符 集中 出 现 的 先后 次 序 确定 。 在 常用 字符 集中 ， 数 字 字 
符 0 一 9、 了 字母 字符 A 一 Z (或 者 a~z) 等 各 目 是 顺序 排列 的 。 汉 字 的 大 小 按 编 码 确 定 。 汉 
字 的 编码 有 几 种 ， 如 我 国 的 国标 码 (GB2312)、 中 国 台湾 地 区 的 Big5 等 。 对 GB2312, 一 
级 字库 (常用 汉字 〉 中 汉字 的 国标 人 码 之 间 的 大 小 关系 ， 与 对 应 的 汉语 拼音 构成 的 串 的 大 小 
关系 一 致 ， 而 二 级 字库 中 汉字 编码 之 间 的 大 小 关系 ， 与 对 应 汉字 的 笔划 数目 的 大 小 关系 一 
致 。 另 外 ， 小 写字 母 的 编码 大 于 大 写字 母 ， 汉 字 的 编 公 大 于 字母 等 ， 因 此 有 : 

容 格 二 …<= “0” ~ “9” << “A” ~ “FT” < ~ 7 < 汉字 

(6) 插入 INSERT(S, i, T): 加 工 型 运算 ， 其 作用 是 将 串 工 插入 到 串 S 的 第 1 个 字符 位 
置 。 其 中 参数 应 满足 : 1<i<LENGTH(S)+1。 例 如 : 

INORRTI"La®. 二 现下 生机 全 

INSERT ("da", 3,"ta")="data" 

(7) 删除 DELETE(S, 1, ]): 加 工 型 运算 ， 其 作用 是 从 S 中 删除 第 1 字符 开始 的 连续 j 
个 字符 。 其 中 参数 应 满足 :1<i<LENGTH(S)，0<j。 例 如 : 

DETETE ("O00 3 21="e0" 

DELETE ("Good™", 3, 0)="Good" 

(8) 子 串 定位 INDEX(S, T): 引用 型 运算 ， 其 作用 是 在 主 串 S 中 查找 是 否 有 等 于 T 的 
子 串 ， 若 有 则 返回 工 在 S 中 第 一 次 出 现 的 位 置 或 指针 ; 否则 返回 零 。 显 然 工 不 能 为 空 串 。 
C/C++ 语言 对 应 的 是 子 串 定位 函数 strstt， 如 strstr(S, T)。 还 有 一 个 类 似 的 字符 定位 函数 
strchr， 如 strchr(S, 'a”))。 例 如 : 

THDEX(™GOGGd". "od"y=3, 
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INDEX ("Good", "do")=0 


(9) 置换 REPLACE(S, i, j, T) 或 REPLACE(S, T, R): 加 工 型 运算 ， 前 者 作用 是 用 工 置 
换 S 中 第 1 个 字符 开始 的 连续 j 个 字符 ;后 者 作用 是 用 及 蔡 换 所 有 在 S 中 出 现 的 、 和 工 相 
等 的 子 串 。 例 如: 

REPLACE ("Who", 3, 1,"ere")="Where" 

REPLACE ("How. do yyou :do.", "do", "DO")="How DO. jyou DO.™" 


严格 说 来 ， 上 述 运算 中 只 有 前 5 个 是 基本 运算 ， 后 面 几 个 不 是 。 比 如 利用 置换 运算 
REPLACE(S, i, j, T) 可 完成 插入 和 删除 功能 : REPLACE(S, i, 0, T) 即 在 串 S 中 第 1 个 位 置 插 
入 串 T; REPLACE(S, i, ],“”) 即 在 串 S 中 删除 从 位 置 i 开始 的 ] 个 字符 。 

又 如 ， 我 们 可 利用 判 等 、 求 串 长 和 求 子 串 等 运算 实现 子 串 定位 INDEX(S, T): 依次 从 
主 串 S 中 第 1 (Ci=1) 个 字符 开始 ， 取 出 长 度 与 工 相同 的 子 串 和 T 比较， 大 相 等 则 子 串 位 置 
为 1; 否则 i 增 ]1 取 下 一 个 子 串 比较 ， 直 到 最 后 找到 或 没有 。 算 法 如 下 : 

int INDEX(string S,string T) { // 假 设 string 为 串 的 类 型 

int m,n,i; 


m=LENGTH (T) ;if (m==0) return 0;//T 为 空 串 
n=LENGTH (S) ， 


for (I=171<=n-m+17I++) // 主 串 搜索 的 合法 位 置 为 1 一 n-m+1， 其 后 至 少 m 个 字符 
if (EQUAL (SUBSTR(S,1,m),T)) return 1; 
return 0; //S 中 没有 子 串 工 


} 


顺便 指出 , 子 串 定位 又 称 串 的 模式 匹配 (Pattem Matching ) 或 串 匹配 (String Matching )， 
其 中 子 串 称 为 模式 串 。 上 述 算法 称 为 朴素 《或 和 负 单 ) 模式 匹配 算法 ， 虽 然 笛 单 ， 但 效率 不 
高 ， 最 坏 时 间 复 杂 度 为 O(o-m+l)m)， 若 nz>m， 则 为 O(mn)。 效 率 高 的 算法 也 有 ， 但 一 般 
较 复 杂 ， 如 著名 的 KMP 〈Knuth-Morris-Pratt) 算法 ， 它 注意 到 匹配 不 成 功 时 ， 子 串 中 已 比 
较 成 功 的 字符 也 就 是 主 串 的 相应 邹 符 ， 分 析 子 串 的 组 成 可 知 主 串 可 从 当前 位 置 接 看 再 和 子 
串 的 某 个 位 置 继续 比较 〈 主 串 位 置 不 回 退 )， 效 率 可 提高 到 OCmn+n)， 有 具体 见 3.3.4 节 。 

之 所 以 将 上 述 串 运 算 定 义 为 基本 运算 进行 单独 实现 ， 而 不 通过 其 他 运算 ， 是 因为 它们 
就 像 数 值 计算 中 对 整 型 变量 进行 四 则 运算 那样 ， 频 或 地 用 在 串 处 理 中 。 因 此 ， 在 引进 串 变 
量 ( 或 等 效 串 变量 ) 的 高 级 语言 中 ,一 般 都 将 它们 作为 基本 运算 符 或 基本 内 部 函数 来 提供 ， 
当然 ， 提 供 的 种 类 和 符号 在 各 个 语言 中 可 能 有 所 不 同 。C/C++ 语 言 提供 了 丰 蜗 的 串 函 数 ， 
其 函数 原型 可 参见 头 文件 stting.h， 上 面 我 们 仅 提 到 了 其 中 比较 章 用 的 几 个 。 


3.3.3 ” 串 的 存储 结构 


存储 串 的 方法 也 就 是 存储 线性 表 的 一 般 方法 ， 不 过 由 于 组 成 串 的 结 点 是 单个 字符 ， 所 
以 在 具体 存储 时 有 一 些 特殊 的 技巧 ， 下 面 分 别 介 绍 。 

1. 顺序 存储 

串 的 顺序 存储 结构 简称 为 顺序 串 ， 即 将 串 中 的 字符 顺序 地 存放 在 内 存 中 一 片 连续 的 存 
储 单元 中 。 

一 般 来 说 ， 一 个 字 和 《8 位 二 进 制 数 ) 束 可 以 表示 一 个 字符 《〈 即 该 字符 的 ASCII 码 )。 
如 果 存 储 单元 是 按 字 编 址 的 ， 则 一 个 内 存单 元 有 多 个 字 节 ， 可 以 存放 多 个 字符 ， 如 32 位 的 
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内 存单 元 可 以 存储 4 个 字符 。 这 时 ， 如 果 一 个 内 存单 元 仍 只 存放 
A ea abdeepte tee 见 图 3.14， 其 中 和 斜 
线 部 分 表示 空闲 字 节 ; 如 果 一 个 内 存单 元 存放 多 个 字符 ,这 种 存 
Was 
储 单元 ,但 对 串 值 进行 访问 时 ， 需 花费 额外 的 时 间 分 离 同 一 存储 
单元 中 的 字符 。 
由 于 C/C++ 语 言 可 以 按 字 节 寻 址 , 于 是 每 个 字符 在 内 存 中 占 
一 个 字 节 ， 串 中 相 邻 的 字符 便 顺 序 存放 在 相 邻 的 字 节 单元 中 ,这 
样 既 节 约 空间 ， 处 理 也 很 方便 。 图 3.14” 非 紧缩 格式 示意 图 
串 是 一 个 字符 序列 , 为 了 表示 串 的 结束 , 可 以 用 一 个 特定 的 、 
不 会 在 串 中 出 现 的 字符 作为 串 的 终结 符 ， 放 在 串 值 的 尾部 。 在 生理 | 全 | 本 


Mr C66 99 [74 |nlelw| 
C/C++ 语 语 [| 中 用 字符 ‘0 作 串 的 终 SH 结 符 ， 如 由 good. mews” 's HN 
的 顺序 存储 结构 如 图 3.16 所 示 。 这 时 顺序 串 可 用 字符 数组 来 
描述 ; 图 3.15 ”紧缩 格式 示意 图 


const int maxsize=100; // 假 设 串 可 能 的 最 大 长 度 是 100 
char ch [maxsize+l]:; // 数 组 的 大 小 要 考虑 额外 加 上 的 终结 符 


2 3 4 5 6 7 8 9 ... maxsize—1 


| 
图 3.16 ”C/C++ 语言 中 顺序 串 存储 结构 示意 图 
各 不 设置 终结 符 ， 还 可 用 一 个 整数 na 来 指示 串 的 长 度 ， 这 时 顺序 串 的 类 型 定义 和 顺序 
表 类 似 : 


const int maxsize=100; // 假 设 串 可 能 的 最 大 长 度 是 100 
typedef struct { 


char ch [maxsize]:; // 串 的 存储 空间 ， 这 时 串 不 需要 终结 符 
int n: // 当 前 串 的 长 度 


} sqstring; 


和 顺序 表 类 似 , 顺序 串 上 的 插入 、 删 除 操作 不 方便 ,操作 中 可 能 需要 移动 大 量 的 学 和 从。 
2. 链 式 存储 
串 的 链 式 存储 结构 人 简称 为 链 串 。 链 串 的 组 织 形式 与 一 般 的 单 链表 类 似 ， 但 链 串 的 一 个 
存储 结 点 可 存储 多 个 字符 。 通 单 将 链 串 中 每 个 存储 结 点 所 存储 的 字符 个 数 称 为 结 点 的 大 小 。 
链 串 的 类 型 定义 如 下 : 
const int nodesize=4; // 结 点 大 小 ， 假 设 为 4 
typedef struct node * pointer; // 结 点 指针 类 型 
struct node { 
char S[nodesizel]; 
pointer next; 
}; 
typedef pointer lkstring; // 链 串 类 型 
与 顺序 串 类 似 ， 如 果 一 个 结 点 只 存储 一 个 字符 〈 结 点 大 小 为 1)， 束 称 为 非 讨 缩 形式 ; 
如 果 一 个 络 点 存储 多 个 字符 ( 结 氮 大 小 大 于 1) 加 称 为 压缩 形式 。 例 如 ,对 串 S=- domwork ”， 
图 3.17 (a)、(b) 分 别 表示 了 结 点 大 小 为 1 和 4 的 两 个 链 串 。 
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ACE CE 


(a) 结 点 大 小 为 1 


S 
>Ldlel [w[=- orlklole 


(b) 结 点 大 小 为 4 
S 
>LdleLilnl kololA 


9| |wlol 
(c) 在 (b) 中 第 二 个 字符 后 插入 “ing” 


图 3.17 链 串 的 存储 结构 示意 图 


结 点 大 小 为 1 的 链 串 衬 间 利 用 率 较 低 ， 因 为 结 点 的 存储 密度 低 ， 如 设 每 个 字符 占 1 个 
字 节 ， 指 针 占 4 个 字 节 ， 则 存储 密度 只 有 20%。 提 高 结 点 的 大 小 可 提高 存储 密度 ， 如 结 点 
大 小 为 4 时 ， 存 储 密度 便 达 到 $0%。 但 结 点 大 小 大 于 1 后 又 会 出 现 新 的 问题 ， 如 串 的 长 度 
不 一 定 正 好 是 结 点 大 小 的 整数 倍 ， 需 用 特殊 字符 〈 例 如 “\02”) 来 填充 最 后 一 个 结 点 ， 以 表示 
串 的 终结 ; 在 插入 、 删 除 运 算 时 ， 可 能 会 引起 大 量 字 符 的 移动 ,给 运算 市 来 不 便 。 图 3.17〈c) 
表示 在 串 S 的 第 2 个 字符 后 插入 “ing” 时 ， 要 移动 前 后 两 个 结 点 中 的 $ 个 字符 。 

显然 ， 结 点 大 小 大 于 1 的 链 串 ， 可 看 成 是 一 种 顺序 与 链 式 相 结合 的 结构 。 

3. 索引 存储 

该 方法 是 用 串 变 量 的 名 字 作 为 关键 字 组 织 索 引 表 〈 名 字 表 )， 索 引 表 中 的 地 址 部 分 除 
了 要 指出 串 存 放 的 起 始 地 址 外 ， 还 必须 有 信息 指出 串 存放 的 末 地 址 。 末 地 址 的 表示 方法 一 
般 有 几 种 : 给 出 串 长 、 给 出 尾 指 针 、 在 串 尾 设置 结束 符 等 。 

索引 表 一 般 是 有 序 的 并 且 顺 序 存 放 ， 串 值 数据 一 般 也 顺序 存放 。 图 3.18 (a) 一 图 3.18〈c) 
表示 了 这 3 种 索引 方式 下 串 的 存储 结构 ， 其 中 的 两 个 串 是 Sl=“where”，S2= “you”。 

以 上 第 三 种 方式 还 有 一 种 变形 ， 即 当 串 很 得， 不 超过 一 个 指针 空间 时 ， 吏 将 它 存 放 在 
指针 域 start 中 。 这 时 为 了 区 分 start 域 到 撒 是 地 址 还 是 串 值 ， 需 要 在 索引 表 中 增加 一 个 标 坊 
位 tag， 称 为 之 特征 位 的 名 字 表 ， 如 图 3.18 〈d) 所 示 。 

在 串 的 顺序 存储 表示 中 ， 串 值 空间 的 大 小 是 在 程序 说 明 部 分 定义 的 ;在 程序 运行 期 间 
串 的 长 度 变 化 范围 不 能 超过 它 ， 否则 会 产生 洲 出 (尤其 在 进行 联接 、 置 换 等 运算 时 )。 如 果 
一 个 程序 要 使 用 很 多 串 ， 对 每 个 串 都 分 配 一 个 可 能 的 最 大 容 间 ， 显 然 容 间 0 浪费 很 大 。 如 果 
采用 链 串 进行 动态 存储 ， 则 结 点 大 了 运算 不 方便 ， 结 点 小 了 空间 利用 率 又 不 好 。 

较 好 的 解决 办 法 是 ， 对 串 采 用 一 种 称 为 堆 结构 ”的 动态 存储 结构 : 在 系统 中 开辟 一 个 
容量 很 大 、 地 址 连续 的 存储 空间 作为 存放 串 值 的 可 利用 空间 。 当 建立 一 个 新 串 时 ， 残 从 该 
空间 中 分 配 一 个 大 小 和 串 的 长 度 相 同 的 、 地 址 连续 的 存储 空间 用 于 存储 新 串 的 值 。 这 样 所 
有 串 的 串 值 都 存储 在 这 个 可 利用 空间 中 ， 同 时 为 每 个 串 建 立 一 个 索引 ， 以 记录 该 串 的 长 上 度 
以 及 该 串 值 在 可 利用 空间 中 的 起 始 位 置 。 这 样 ， 利 用 串 的 索引 存储 方法 ， 可 实现 多 个 串 值 
空间 的 共享 和 动态 分 配 。 


G 一 般 把 动态 存储 区 分 为 (组 织 成 ) 栈 区 和 堆 区 ， 前 者 用 于 具有 后 进 先 出 特点 的 数据 ， 后 者 用 于 无 
后 进 先 出 特点 的 数据 。 
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name length start const int namemax=8; / /名 字 最 长 字符 数 


S1 5| =- typedef struct { 


S2| 3| 、 char name [namemax+1];// 假 设 串 名 带 结 束 符 
33 TwnlelrTely [Toll ne, seth, 


} node; 


(a) 带 长 度 的 名 字 表 


name end start 
const int namemax=8; / /名 字 最 长 字符 数 
typedef struct { 
char name [namemaxt+]1 1; // 假 设 串 名 带 结 束 符 
char *end,*start; 
} node; 


(b) 市 尾 指针 的 名 字 表 
name start const int namemax=8，; / /名 字 最 长 字符 数 
typedef struct { 
char name [namemax+1];// 假 设 串 名 带 结束 符 
char *start; 
} node; 


(c) 在 串 尾 设置 结束 符 
name tag start/value const int namemax=8; / /名字 最 长 字符 数 


typedef struct { 


char name [namemax+1];// 假 设 串 名 带 结 束 符 


whlelrlelol… aa 
char *start; 
char value[4]; 


sah [you 


(d) 带 特 征 位 的 名 字 表 } 


} node; 


图 3.18” 捉 的 索引 存储 结构 示意 图 


例如 ， 在 文本 编辑 程序 中 ， 可 以 为 整个 文本 建立 一 个 文本 绥 冲 区 〈 堆 )， 文 本 的 每 一 
行 可 看 成 一 个 字符 串 ， 并 为 每 一 行 建 一 个 索引 。 此 时 索引 表 的 名 字 域 就 是 行 号 ， 故 又 称 为 
行 表 。 奋 干 行 组 成 一 页 ， 也 可 为 每 一 页 建 一 个 索引 得 到 页 表 。 在 给 一 个 串 分 配 衬 间 时 ， 是 
在 当前 堆 中 的 宇 朵 位 置 处 进行 的 ， 故 需要 一 个 指针 指示 当前 空闲 区 位 置 ， 它 的 初 值 为 0， 
每 分 配 完 一 个 串 后 ， 就 修改 该 指针 。 在 具体 使 用 时 ， 还 有 些 问 题 需要 解决 ， 如 已 删除 串 的 
空间 再 利用 、 在 串 中 插入 时 如 何 扩 充 它 的 空间 等 。 

在 C/C++ 语言 中 , 就 存在 一 个 称 为 堆 的 动态 存储 区 , 由 C 的 系统 函数 malloc( ) 和 free( ) 
或 C++ 的 操作 符 new 和 delete 来 动态 管理 。 

例 3.5 编写 算法 ， 比 较 两 个 串 的 大 小 ， 不 要 使 用 系统 函数 strcpy。 

解 : 两 个 串 的 比较 就 是 从 头 开始 逐个 字符 比较 ， 寿 全 部 相等 则 返回 0， 否则 返回 当前 
不 等 字符 的 ASCII 码 之 着 《各 有 茶 个 串 先 比较 完 ， 则 可 视 其 当前 字符 为 空 )。 

如 果 是 顺序 串 ， 并 用 上 述 sqstring 类 型 表示 ， 则 算法 如 下 : 


int comp (sqstring *s]l,sqstring *s2) { 


int 1,m; 

if (sl->n<s2->n) m=s1->n; // 找 较 短 的 长 度 
else m=Ss2—>n; 

1=0; 


while(i<m && sl1->ch[1]==s2->ch[1]) i++; 
1 (i= gE T= vn) rotary Us // 两 串 相 同 
else if(i==sl->n) return -s2->ch[i];y //sl 串 较 短 


Wx 数据 结构 教程 与 题解 


else if(i==s2->n) return 5s1->ch[i]; //s2 串 较 短 
else return sl1l->ch[i]-s->ch2[1]; 


} 
如 果 是 链 串 ， 且 结 点 大 小 为 1， 则 算法 如 下 : 


int comp (lkstring S,1lkstring T) { 
pointer p,q; 


p=3; 

q=T; 

while(p!=NULL && gq!=NULL && p->ch==q->ch) {p=p->next;dqdq=q->next;} 
if (p==NULL && qd==NULL) return 0; // 两 串 相 同 

else if (p==NULL) return -q->ch; //S 串 较 短 

else if(gq==NULL) return p->ch; //E 串 较 短 


else return p->ch-q->ch; 
} 


以 上 两 种 算法 ， 运 算 量 和 难 易 程度 相当 。 但 是 ， 如 果 采 用 融 结 束 符 “\0” 的 顺序 串 ， 
则 算法 显得 非常 简便 : 
int comp(char S1[],char s2[]) { 
了 和 二 一 
1=0; 
while(sl[i]!'=’\0 && sl1[1i1]==s2[1]) 1i++; 
return sl[1i]-s2[1]; 
} 


串 的 一 些 其 他 运算 ， 如 联接 、 找 贝 等 ， 用 市 结束 符 的 顺序 串 实 现时 ， 也 都 比较 简便 。 
所 以 ， 串 在 实际 使 用 时 ， 经 党 采用 市 结束 符 的 顺序 串 。 

本 区 讨论 了 串 的 几 种 最 基本 的 存储 表示 方法 ， 对 于 有 具体 的 应 用 问题 ， 还 可 以 根据 实际 
情况 设计 出 更 为 合理 有 效 的 《组合 型 ) 存储 方法 。 


3.3.4 ” 串 的 模式 匹配 


串 的 模式 匹配 《或 称 子 串 定 位 ) 是 各 种 串 处 理 系 统 中 最 重要 的 运算 之 一 ， 对 其 效率 的 
改进 和 提高 有 重要 的 实际 意义 。 人 们 提出 了 许多 效率 不 同 的 算法 ， 以 下 介绍 两 种 算法 ， 假 
设 串 的 储存 结构 为 上 节 定 义 的 顺序 串 。 

1. BF 算法 

在 3.3.2 节 给 出 了 用 串 的 其 他 运算 实现 的 简单 模式 匹配 算法 ， 基 本 思想 是 依次 从 主 串 
的 各 字符 位 开始 与 子 串 进行 匹配 ， 直 到 匹配 成 功 或 最 终 失 败 。 为 了 提高 效率 ， 可 写 出 不 依 
赖 其 他 串 运 算 的 匹配 算法 ， 下 面 就 是 其 中 一 种 实现 : 

int index(sqstring *s,sqstring *t) {//BF 算法 

a 
1=0,]J=0; 
while(i<s->n && ]<t->n) { 
if (s->data[i]==t->data[j]) {i++;j++;?}// 对 应 字符 相等 时 间 后 推进 
else {1=1i-J+l1;]=0;} //i 退 到 主 串 下 一 趟 开始 位 置 ，j 重新 开始 
} 
if (]>= 七 ->n) return i-t->n; 
else return -1; 
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该 算法 常 称 Brute-Force 算法 (简称 BF 算法 )， 其 中 每 次 匹配 失败 时 ， 主 串 指针 1 要 
退 到 下 一 趟 的 开始 位 置 。 算 法 的 最 好 时 间 复 杂 性 为 O(m)， 最 坏 时 间 复 杂 性 为 Omm)， 其 中 
n、m 分 别 为 主 串 、 模 式 串 的 长 度 。 

2. KMP 算法 

这 是 一 种 改进 的 串 匹 配 算法 ， 由 D. E. Knuth 与 V. R. Pratt 和 J.H. Morris 同时 发 现 %， 
常 称 KMP 算法 。 该 算法 的 时 间 复 杂 度 为 O(nt+m)。 其 基本 思想 是 : 每 当 匹 配 失败 时 ， 主 串 
指针 i 不 回 退 ， 而 是 根据 已 匹配 的 信息 将 模式 向 右 “ 滑 动 ”一 定位 置 后 继续 进行 比较 。 

设 比较 失败 时 主 串 、 模式 串 位 置 分 别 为 i、j， 即 si 天 6， 之 前 “tot 12 一 “Sisirl Si ”， 
其 中 并 (=i ) 为 本 趟 比较 开始 时 的 主 串 位 置 ， 见 图 3.19 (a) 所 示 。 若 下 趟 从 主 串 的 下 一 
位 置 1+1 (=1-j+1) 开始 比较 ， 则 首先 比较 ttrsisl 是 人 耕 成 立 ， 由 于 sy=t1， 这 相当 于 比较 to 
和 ft， 和 用 to 关 t 则 本 趟 比较 肯定 失败 ， 类 似 ， 辱 to 关 tb， 则 从 主 串 位 置 1+2 (=i-j+2) 开始 
比较 也 肯定 失败 ……。 


7 EP 
| | |* [|| | [| | +#* 
本 二 本 
-ee 
(a) si 夫 6 拓 配 ， (b) 模式 串 右 移 到 所 与 si 对 齐 


图 3.19 KMP 算法 原理 


一 般 地 ， 大 模式 串 茶 位 置 p 〈p 乏 j-1) 满足 t=tp， 则 主 串 至 少 可 从 与 外 对 应 的 位 置 了 
(=1+p) 开始 比较 《〈 大 这 种 位 置 有 多 个 ， 则 先 考 得 前 面 的 )。 但 这 里 只 考虑 了 比较 的 第 一 个 
字 件 。 显 然 ， 夺 比较 能 进行 下 去 ， 还 应 有 ti=tpri, to=tpr2, “**o 易 见 ， 这 种 相等 关系 应 一 直 
延续 到 t_-1!， 盏 则 该 趟 比较 仍 失败 ， 需 找 下 一 个 与 t。 相 等 的 位 置 ， 骨 进行 同样 的 处 理 ……。 

设 前 后 共有 个 字符 对 应 相等 ， 即 “toti…tkry” 二 “tptpr2…*t1”， 如 图 3.19 (b)》 所 示 ， 
本 赵 比 较 主 串 可 从 位 置 1" (=i1'+p) 开始 ， 但 “siw…si-1” 都 与 模式 串 中 “to…tk-1” 对 应 学 符 
相等 ， 这 部 分 比较 并 不 需要 真 的 进行 ， 只 震 从 si 开始 与 模式 串 的 妇 开 始 比较 即 可 。 可 见 ， 
比较 失败 时 主 串 位 置 i 不 需 回 退 ， 记 next[j]=k， 则 下 次 继续 和 twexwj 比 较 。 这 相当 于 比较 失 
败 时 将 模式 串 右 移 到 女 和 si 对 齐 后 继续 比较 。 

“toti…tk1 ”=“tpttt1” 的 含义 是 在 失 配 字符 之前， 模式 串 的 首尾 k 个 字符 对 应 
相等 。 若 这 种 子囊 有 多 个 ， 则 取 最 长 的 一 个 《尾部 串 从 可 能 的 最 前 面 的 位 置 开 始 )。 

若 1 之 前 没有 首尾 相同 的 子 串 ， 则 取 k=0， 即 模式 串 从 开始 与 主 串 si 开始 进行 比较 。 
略 这 时 t 关 $4， 则 进行 新 一 趋 的 比较 ， 即 从 to 与 si 开始 比较 。 

如 上 所 述 , next[j] 只 取决 于 模式 串 ， 反 映 模式 串 本 身 的 局 部 匹配 信息 , 一 般 定义 如 下 : 


| 当 j=0 时 
next]j|=y3max{k|0<k<j 且 “to to 一 tt) 当 此 集合 非 空 时 
0 其 他 情况 


GD 1970 年 Cook 的 一 个 理论 结果 表明 有 算法 能 在 大 约 mtn 时 间 内 解决 模式 匹配 问题 .D. E. Knuth 和 
V. R. Pratt 在 重建 Cook 的 证 明 时 创建 了 这 个 模式 匹配 算法 ; 大 概 同 一 时 间 J H. Morris 在 设计 文本 编辑 器 
时 也 创建 了 差不多 同样 的 算法 。 

@ 也 可 令 j=0 时 next[0]=0， 这 时 需 对 KMP 算法 (以 及 求 next 的 算法 ) 语句 略 作 调 整 ， 具 体 略 。 
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KMP 算法 如 下 : 
int KMP (sqstring *s,sqstring #t) {//KMP 算法 
人 
int next [MMAX]; 
NEXT (t, next); // 求 模式 串 上 的 next 数组 
1=0,]J=0; 
while(i<s->n && ]<t->n) { 
1If(]==-1 || s->data[i]==t->data[j]) {i++;]++;} 
else J=next [Jj]; 
} 
1if (]>= 七 ->n) return 1i-t->n; 
else return -1; 


} 

算法 的 主要 运算 是 字符 比较 ， 从 while 循环 可 见 ， 该 运算 量 不 超过 让 条 件 测试 次 数 ， 
而 后 者 等 于 1、j 前 进 〈i++:j++) 次 数 〈 条 件 成 立时 ) 与 ] 回 退 (CFanext[]) 次 数 〈 条 件 不 成 
立时 ) 之 和 。 由 于 i<n， 故 i 前 进 次 数 为 O(n)。j 随 i 同步 前 进 ， 故 j 前 进 次 数 也 为 O(n)。 
注意 ] 前 进 时 每 次 为 1 位 、 回 退 时 每 次 可 多 位 ， 而 前 进 、 回 退 的 总 结果 ， 即 最 终 匹配 成 功 
或 失败 时 jz>z0， 所 以 ]j 回 退 次 数 不 超 过 前 进 的 次 数 OO)。 于 是 字符 比较 《〈 以 及 整个 while 循 
环 ) 的 时 间 复 杂 度 为 O(n)。 男 外 ， 求 next 数组 ( 见 下 文 所 述 ) 的 时 间 复 多 上 度 为 O(m)， 所 
以 KMP 算法 的 时 间 复 洒 度 为 O(nt+m)。 

下 面 看 看 next 数组 的 求法 。 辱 按 定 义 直 接 对 每 个 位 置 都 进行 前 后 重复 子 串 的 测试 ， 显 
然 效 率 不 高 ， 这 里 采用 递 推 方 法 。 

首先 由 定义 得 next[0]= -1。 设 已 求 出 nextj]k， 即 “toti…tkp”== “tptpr…*…t1”， 大 下 
一 字符 t=t， 则 “toti…tk”= “tptpr…”， 即 下 一 位 置 的 前 后 香 复 串 长 比 当前 位 置 的 多 1， 
所 以 next[j+1]=k+l= next[j]+1。 

在 tk 关 1， 这 时 奢 把 s=“toti…tptpr…” 看 成 主 串 ，t==“tot1…tk” 看 成 模式 串 ， 问 题 变 
为 两 者 在 1 关 tk 之 前 已 匹配 “tptpr…1”==“toti…tk-1”， 与 前 述 KMP 算法 推导 类 似 ， 这 时 
主 串 位 置 j 不 动 ， 继 续 和 模式 串 的 k=next[k] 处 比较 (模式 串 右 移 )。 于 是 ， 重 复 前 面 的 过 
程 ， 夺 tx=ti 则 next[j+1]=k+l=next[kl+1; 大 tk 关 1 则 主 串 位 置 ] 不 动 ， 继 续 和 模式 串 的 
k"=next[k'] 处 比较 (模式 串 右 移 )…… ， 依 次 类 推 ， 直 到 6 和 模式 串 的 茶 字 符 匹 配 成 功 ， 或 
者 始终 不 匹配 则 令 next[j+1]=0。 

可 见 ， 求 next 数组 的 过 程 相当 于 模式 串 的 “自我 匹配 ”， 算 法 与 前 述 KMP 算法 类 似 ; 

void NEXT (sqstring *t,int next[]) {// 求 next 

1 Tk 
]=07k=-17next [0]=-1; 
whlle (]< 七 ->n-1) { 
1fE (Kk==-1 || 七 ->qata[]]== 七 ->qata[k]) { 
] + 二 7 K++; 
next [] ] =Ky; 
} 
else k=next[k]; 
} 

} 

类 似 前 述 KMP 算法 的 分 析 ， 访 和气 法 的 时 间 复 洒 度 为 O(m)。 

这 里 的 next 数组 尚 可 改进 : 在 模式 匹配 中 ， 设 next[]]=k， 帮 ttk， 则 在 si 和 6 时 必 有 
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$i 六， 即 后 一 比较 是 多 余 的 ， 可 直接 和 trextpg 比 较 ， 即 此 时 可 令 next]=next[k]。 改 进 算法 
如 下 《匹配 算法 不 变 ): 


void NEXTVAL(sqstring #t, int nextval[]) {// 求 改进 的 next 
nt "rks 
J]=0;k=-1;nextval{[0]=-1; 
while (Jj<t->n-1) { 
if (k==-1] || 七 ->qata[]]== 七 ->qata[K]) { 
J++;? K++; 
1f(t->data[j]==t->data[k]) nextval[]j]]=nextvall[lk]; 
else nextval[]]=k; 


} 
else k=nextval [k]; 


} 
} 
例 3.6 设 日 标 串 s=“abcaabbabcabaacba”， 模式 串 t=“abcabaa”， 男 出 BF 算法 、KMP 
算法 、 改 进 KMP 算法 的 模式 匹配 过 程 示 意图 ， 它 们 分 别 要 进行 多 少 趟 匹配 ? 
解 : 对 KMP 算法 要 先 求 出 next、nextval 函数 值 ， 见 表 3.1 所 示 。[ 匹 配 过 程 如 图 3.20 
所 示 ， 三 种 算法 所 需 的 匹配 趟 数 分 别 为 8、5、4 趟 ， 其 中 KMP 算法 在 next 数组 改进 前 多 
了 一 趋 无 用 的 比较 (虽然 只 比较 了 一 个 字符 )。 


表 3.1 模式 串 的 next、nextval 函数 值 


趟 数 abcaabbabcabaacba 
i 从 0 到 4 ”调整 ”i=4 


1 abcab… jMO 到 4 ”> j=nextl[4]=1 
2 abc… 了 1 到 2 Fret2-0 
趟 数 abcaabbabcabaacba 3 4: a EE earo- 1 三 120 
1 a ? cab… ij 从 0 到 4 ee JMO 加 整 、 XOl=1 于 地 避 : 
2 a I i 从 1 到 1 5 abcabaa ee 成 功 
3 a i 从 2 到 2 (b) KMP 算法 
4 ab i 从 3 到 4 趟 数 abcaabbabcabaacba 
5 , ee ij 从 4 到 4 1 Ps Ce 0 ed 
6 Lg Ce i 从 5 到 7 . Le Ce*** Se 下 a 
7 pa i 从 6 到 6 3 | i oa ER 二 二 可 本 
8 abcabaa iM7 到 14 4 abcabaa Moay 成 功 
(a) BF 算法 (c) 改进 KMP 算法 


图 3.20 三 种 算法 下 的 模式 匹配 过 程 


最 后 需要 指出 ， 以 上 在 KMP 算法 的 叙述 中 ， 串 元 素 序 号 是 从 0 开始 的 ， 这 与 C/C++ 
数组 下 标 从 0 开始 一 致 〈 应 用 到 C/C++ 语言 的 以 “\0” 结 尾 的 顺序 串 也 非常 方便 );， 在 从 1 
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开始 , 则 各 字符 对 应 的 next 值 要 比 这 里 多 1%, 而 串 字 符 的 存储 , 比如 sb 要 么 存放 到 s[i-1]， 
要 么 仍 存 放 到 s[1] (0 号 单元 不 用 或 作 它 用 ) 有 关 算 法 语句 也 需 略 作 调整 ， 具 体 略 〈 参 见 


习题 3.21 )。 
站 题 二 
3.1 设 {A, B,C,D,E,F} 依 次 进 栈 ， 出 栈 序列 为 {B,D, C, 下 ,EE,A}， 则 栈 的 容量 至 少 为 
多 少 ? 
3.2 证 明 : 


(1) 设 入 栈 序列 为 {1, 2，…, nq}， 则 出 栈 序列 不 可 能 为 {…, kk …, 革 … j .4}， 其 中 ij<k 
(2)“ 设 入 栈 序列 为 {1, 2，…, n}， 则 所 有 可 能 的 出 栈 序列 个 数 为 一 一 C3 


3.3 ”能 人 否 用 栈 实 现 队 列 的 功能 ? 

3.4 设 两 个 顺序 栈 共享 空间 , 试 写 出 两 个 栈 公 用 的 栈 操作 算法 push(x, k) 和 pop(k), 其 
中 kk 为 0 或 1， 用 以 指示 栈 号 。 

3.$ 设 一 批 数 据 有 正 有 负 , 试用 栈 对 它们 进行 调整 , 使 输出 时 所 有 负数 都 在 正 数 之 前 。 

3.6 ”设计 算法 ， 判 断 一 个 算术 表达 式 中 的 圆 括号 是 奋 正 确 配 对 。 

3.7 ”设计 算法 ， 售 助 栈 将 单 链表 逆 置 。 

3.8” 设 单 链表 中 存放 看 n 个 字符 ， 编 写 算 法 ， 判 断 该 字符 串 是 否 有 中 心 对 称 关 系 〈 又 
称 回 文 )， 例 如 xyzzyx、xyzyx 都 是 中 心 对 称 的 字符 串 。 

3.9” 试 设计 递归 算法 ， 计 算 1+2+3+…+n。 

3.10 ” 设 用 尾 指针 表示 的 市 头 结 点 的 循环 链表 来 表示 队列 ， 试 写 出 出 队 和 入 队 算 法 。 

3.11 设 循 环 队列 为 A[0..m-1]， 队 头 指针 front 指 回 队 头 的 前 一 个 位 置 ， 队 尾 指针 rear 
指 问 队 尾 ， 队 列 元 素 个 数 为 len。 若 已 知 font、rear 和 len 中 的 两 个 ， 则 另 一 个 为 多 少 ? 

3.12 ” 设 循 环 队列 为 A[0.m-1]， 队 头 指针 front 指 问 队 头 的 前 一 个 位 置 ,， 队 尾 指针 rear 
指 癌 队 尾 。 分 别 对 下 列 各 种 情况 ， 写 出 出 队 和 入 队 算 法 : 

(1) 不 设 队 头 指针 front， 而 设 队 尾 指针 rear 和 队列 元 素 个 数 len。 

(2) 不 设 队 尾 指针 rear， 而 设 队 头 指针 front 和 队列 元 素 个 数 len。 

(3) 除了 队 尾 指针 rear 和 队 头 指针 front 外 ， 另 设 一 个 表示 队 衬 或 满 的 标志 位 flag。 

3.13 ” 设 循环 队列 为 A[1..m]， 队 头 指针 front 指向 队 头 的 前 一 个 位 置 ， 队 尾 指 针 rear 
指 问 队 尾 。 写 出 队列 运算 的 主要 语句 。 

3.14 ” 设 循 环 队列 为 A[0.m-1], 若 将 队 头 指针 front 指 癌 队 头 ( 而 不 是 其 前 一 个 位 置 )， 
队 尾 指针 rear 指 问 队 尾 。 写 出 队列 运算 的 主要 语句 。 

3.15 ” 设 茶 栈 中 元 素 依 次 为 {Al1，Az,…，An}，An 为 栈 项 ; 条 队列 中 元 素 依 次 为 {Bi 
Es Bn} , Bl 为 队 头 。 现 要 将 栈 中 元 素 调整 到 队列 中 》 使 队列 中 元 素 依 次 为 {Bi, Al B;, A>， 


Q 这 只 是 表面 上 不 同 ， 实 际 执行 过 程 是 相同 的 ， 比 如 从 0 开始 编号 时 某 字 符 x 的 next 为 k， 即 下 次 
要 退 到 编写 为 k 的 字符 y， 而 从 1 开始 编号 时 该 字符 y 的 编号 正 是 k+1。 
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Bs, As，…, Bn, As} 。 试 给 出 一 种 实现 方法 ， 并 分 析 其 运算 量 〈 每 次 出 、 入 栈 或 队列 算 1 次 
基本 运算 )。 

3.16 ” 简 述 下 列 每 对 术语 的 区 别 : 空 串 和 空格 串 ， 串 变量 和 串 常 量 ， 主 串 和 子 串 ， 串 
名 和 串 值 。 

3.17 大 两 个 串 S 和 T 荆 的 连接 concat(S, 了 T)=concat(T,S)， 试 分 析 所 有 可 能 的 S 和 工 。 

3.18 ”编写 算法 ， 将 两 个 串 连 接 起 来 ， 不 要 使 用 系统 函数 strcat。 

3.19 ”编写 算法 ， 将 串 S2 拷贝 到 串 S1 中 ， 不 要 使 用 系统 函数 strcpy。 

3.20 设 S$S、 TI 是 两 个 结 点 大 小 为 1 的 链 串 ， 编 写 算法， 找 出 S 中 第 一 个 不 在 工 中 出 


现 的 字符 。 
3.21* 对 如 下 储存 结构 ， 试 写 出 KMP 算法 : 
#define MMRAX 100 / /MMAX 为 串 长 上 限 (不 能 超过 1 字 节 最 大 整数 255) 


typedef char sstring[MMAX+1];//0 与 单元 存放 串 长 (不 能 超过 MMRAX) 


3.22* 设 模 式 串 为 区 “abcaacabaca”， 写 出 其 next、nextval 数组 值 。 
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前 和 面 几 半 介 绍 的 线性 表 、 栈 、 队 列 和 串 都 是 线性 结构 ， 本 章 将 要 介绍 多 维 数组 和 广义 
表 ， 它 们 是 复杂 的 非 线 性 结构 ， 因 为 所 选 内 容 不 多 ， 放 在 同一 半 中 讨论 。 

多 维 数 组 中 的 元 素 同 时 属于 多 个 线性 表 ， 可 认为 是 一 种 广义 的 线性 表 。 数 组 几乎 是 和 
程序 设计 语言 同时 诞生 的 ， 但 在 程序 设计 语言 中 ， 重 点 是 数组 的 使 用 ， 本 章 则 是 介绍 数组 
的 内 部 实现 ， 主 要 是 数组 的 存储 方式 与 寻 址 ， 以 及 矩阵 的 压缩 存储 。 

广义 表 是 一 种 特殊 的 数据 结构 ， 它 兼 有 线性 表 、 树 、 图 等 结构 的 特点 。 从 各 层 元 素 各 
目 具 有 的 线性 特征 方面 看 ， 它 应 该 是 线性 表 的 推广 ;从 元 素 的 分 层 方面 看 ， 它 有 树 结 构 的 
特点 ;但 从 元 系 的 递归 性 和 共享 性 等 方面 看 ， 它 应 该 属于 图 结构 。 总 之 ， 它 是 一 种 更 为 复 
杂 的 非 线性 结构 。 本 重 只 介绍 广义 表 的 基本 概念 和 储存 结构 。 


.人 多 维 数组 


数组 (Aray) 是 一 种 十 分 常用 的 结构 类 型 ， 程 序 设计 语言 一 般 都 直接 支持 数组 类 
型 。 数 组 中 各 元 素 的 类 型 相同 ， 并 且 元 素 的 个 数 和 元 素 间 的 关系 在 数组 建立 后 一 般 不 能 
改变 。 

多 维 数 组 可 看 成 线性 表 的 推广 。 对 一 维 数组 ， 它 就 是 一 个 线性 表 ; 对 二 维 数组 ， 可 看 
成 每 个 元 素 为 一 维 数组 的 线性 表 , 这 个 元 素 可 以 是 行 问 量 , 也 可 以 是 列 癌 量 , 示意 见 图 4.1。 


all al 7 dn dll diy aln Em dy | 

dy dy 7 dn 321 dy a [ay dy a,, | 
a : : : Nn : : | : i 

a dnl an |a an ~ au | 

(a) 二 维 数组 (b) n 个 列 癌 量 (c) m 个 行 同 量 


4.1 二 维 数 组 


关 似 地 ， 一 个 三 维 数组 可 看 成 每 个 元 素 为 二 维 数组 的 线性 表 。 一 般 地 ， 一 个 n 维 数组 
可 看 成 每 个 元 素 为 n-1 维 数 组 的 线性 表 。 与 此 类 似 ， 在 C/C++ 语言 中 ， 对 多 维 数 组 ， 除 了 
可 以 直接 定义 外 ， 还 可 以 这 样 定义 : 将 二 维 数 组 定义 为 每 个 元 素 为 一 维 数 组 的 数组 ， 将 三 
维 数 组 定义 为 每 个 元 素 为 二 维 数组 的 数组 等 。 例 如 下 列 定 义 实际 上 定义 了 二 维 数组 
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Int x[ml|[n|: 


const int m=10; 

const 1nt T=5s 

typedef int RI[n]; 

R x[m]; //x 有 mm 个 元 素 ， 每 个 元 素 是 R 类 型 (n 个 元 素 的 一 维 数组 ) 


多 维 数 组 的 每 个 元 素 受 多 个 线性 关系 的 约束 ， 可 有 多 个 卫 接 前 趋 和 下 接 后 继 ， 故 是 非 
线性 结构 。 例 如 ， 二 维 数组 中 每 个 元 素 既 在 东 一 行 上 ， 也 在 茶 一 列 上 ， 而 每 一 行 、 每 一 列 
上 的 元 素 部 是 线性 关系 ， 于 是 在 整个 数组 中 ， 每 个 元 素 可 有 两 个 直接 前 趋 和 两 个 直接 后 继 
〈 行 、 列 方 问 各 一 个 )， 从 而 是 非 线 性 结构 。 当 然 ， 首 元 素 all 没有 前 趋 、 尾 元 素 am 没有 后 
继 ;， 第 一 列 / 行 元 素 没 有 行 / 列 方 癌 的 前 趋 ， 最 后 一 列 / 行 元 素 没 有 行 / 列 方向 的 后 继 。 

数组 通常 只 有 两 种 基本 运算 一 一 恋 和 与 : 

(1) 读 。 给 定 一 组 下 标 ， 读 出 相应 的 元 素 。 

(2) 写 。 给 定 一 组 下 标 ， 修 改 相 应 的 元 素 。 


42 数组 的 存储 结构 


数组 是 一 种 在 高 级 语言 中 已 经 实现 了 的 数据 结构 : 其 类 型 定义 由 高 级 语言 的 数组 类 型 
直接 给 出 ;， 由 于 没有 插入 和 删除 运算 ， 存储 结 构 采 用 的 是 顺序 存储 方式 ; 读 写 通过 下 标定 
位 和 赋值 运算 来 完成 。 下 面 只 讨论 其 中 下 标定 位 的 原理 一 一 寻 址 问题 ， 并 假设 数组 元 素 的 
下 标 是 有 效 的 (注意 C/C++ 语言 并 不 检测 数组 下 标的 合法 性 )。 

在 讨论 地 址 问题 时 ， 一 般 取 数 组 开始 结 点 的 地 址 作为 基准 ( 基 址 )， 然 后 考察 其 他 结 
点 相对 此 基 址 的 偏 移 量 〈 偏 移 地 址 )。 显 然 ， 基 址 加 上 任 一 结 点 的 偏 移 量 就 是 该 结 点 的 绝对 
地 址 。 

一 维 数 组 的 每 个 元 素 只 含 一 个 下 标 ， 其 实质 就 是 线性 表 ， 采 用 顺序 存储 时 与 线性 表 的 
顺序 存储 结构 (顺序 表 ) 基本 相同 ， 即 将 数组 各 元 素 按 它们 的 逻辑 次 序 依次 存储 到 一 片 连 
续 的 存储 单元 中 ,但 这 里 元 素 的 个 数 是 固定 的 ,不 能 改变 。 设 一 维 数组 为 A=[ao, ai，…, an_1]， 
元 素 ao 的 地 址 为 LOC(0)， 每 个 元 素 占用 的 存储 单元 数 为 c， 则 元 素 ai 的 地 址 LOCQ) 为 : 

LOC(i)=LOC(0)+ixc 

如 果 数 组 元 素 的 下 标 从 1 开始 ，A=[ai, aa，…, at]， 则 元 素 ai 的 地 址 为 

LOC()=LOC(1)+(i-1)xc 

一 般 地 ， 若 数组 元 素 的 下 标 范围 为 [s,t]， 即 A=[as, ai，…, al， 则 元 素 ai 的 地 址 为 : 

LOC()=LOC(s)+(i—s)xe 

二 维 数组 的 每 个 元 素 含 有 行 、 列 两 个 下 标 ， 例 如 : 
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是 一 种 非 线性 结构 ， 但 内 存单 元 是 一 维 的 线性 结构 ， 在 进行 顺序 存储 时 ， 需 要 将 多 维 关系 
映射 为 一 维 的 线性 关系 ， 第 用 的 方法 有 如 下 两 种 。 
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1. 按 行 存放 〈 行 优先 ，Row-major Ordering) 

在 这 种 方法 中 ， 从 数组 的 第 一 行 开 始 ， 每 一 行 按 从 左 到 右 的 顺序 〈 列 号 递增 ) 对 数组 
元 素 依次 存放 。 例 如 ， 对 上 面 的 二 维 数 组 A， 按 行 存储 的 元 素 次 序 为 : 

在 Pascal、C/C++ 语 诗 中 ， 数 组 就 是 按 行 存储 的 。 

设 二 维 数组 的 一 般 形式 为 A[s..t, q..r]“， 这 里 s 和 9q 不 一 定 是 1 或 0。 对 元 素 ai， 它 前 
面 一 共有 is 行 ， 每 一 行 有 Tr-q+l 个 元 素 〈 即 列 数 )， 第 1 行 从 开始 到 ai 为止 有 j-q+l 个 元 
素 ， 故 从 数组 开始 到 ai 为 止 的 元 素 个 数 为 : 

=(Q1-s)x(r-qt+1)+Q-qt+1) 

相应 地 ， 元 素 ai 的 地 址 LOC(i,]) 为 : 

LOC(i, j))=LOC(s, q)}+(h—1)xc=LOC(s, q)+{(i-s)x(r-q+1)+(j-q)]xc 

其 中 ，c 为 每 个 元 素 所 占 的 存储 单元 数 。 

例如 ， 对 数组 A[L.m, 1..n]， 元 素 aii 的 地 址 为 : 

LOC(Gi, j)=LOC(1, 1)+[(G—1)xn+(-1)]xc 

特别 地 ， 对 C/C++ 语言 数组 A[m][n]， 即 A[0.m-1, 0.n-1]， 元 素 ai 的 地 址 为 : 

LOC(i )=LOC(0. 0)+[ixn+Hj]xc 

2. 按 列 存放 〈 列 优先 ，Column-major Ordering ) 

在 这 种 方法 中 ， 从 数组 的 第 一 列 开 始 ， 每 一 列 按 从 上 到 下 的 顺序 〈 行 号 递增 ) 对 数组 
元 素 依次 存放 。 例 如 ， 对 上 面 的 二 维 数组 A， 按 列 存储 的 元 素 次 序 为 : 

在 FORTRAN 语言 中 ， 数 组 就 是 按 列 存储 的 。 

上 述 规则 可 推广 到 多 维 数组 的 情形 : 

(1) 按 行 存储 时 ， 对 每 一 个 左下 标 ， 逐 个 变动 其 右边 的 下 标 《〈 和 人 简称 右 下 标 先 动 )， 或 
者 说 ， 先 变动 最 右 的 下 标 ， 从 右 到 左 ， 最 后 变动 最 左 的 下 标 。 

(2) 按 列 存储 时 ， 对 每 一 个 右 下 标 ， 逐 个 变动 其 左边 的 下 标 〈 简 称 左 下 标 先 动 )， 或 
者 说 ， 先 变动 最 左 的 下 标 ， 从 左 癌 右 ， 最 后 变动 最 右 的 下 标 。 

如 对 三 维 数组 A[2..4, 0..1, 1..3]， 按 行 存储 的 元 素 次 序 为 : 

以 三 维 数组 A[1..m, 1..n, 1..p] 为 例 ， 按 行 存储 时 ， 元 素 aik 的 地 址 为 : 

LOC(i, j 9=LOC( 1, D+[(G—1)xnxp+(—1)xp+(k—1)]xc 

易 见 , 不 论 是 按 行 存储 还 是 按 列 存储 ， 数 组 元 素 的 地 址 都 是 其 下 标的 线性 函数 ， 所 以 ， 
任 一 元 素 都 可 在 相同 的 〈 逻 辑 ) 时 间 内 存 取 ， 故 数组 是 一 种 随机 存 取 结构 。 


和 .3、 答 阵 的 压缩 存储 


矩阵 是 一 种 利用 的 数学 对 象 ， 当 其 元 素 类 型 相同 时 ， 我 们 一 般 用 二 维 数组 来 表示 ， 此 
时 需要 存储 全 部 的 元 素 。 但 是 ， 如 果 和 矩阵 的 非 去 元 素 呈 茶 种 规律 分 布 ， 或 者 有 大 量 的 零 元 
G@ 本 书 对 多 维 数组 使 用 了 两 种 写法 〈 不 涉及 具体 语言 时 )， 如 A[s..t, q.9] 也 写 做 A[s.H[q.z， 相 应 地 


元 素 ai 就 分 别 写 做 A[ij] 和 AD]D]。 但 对 特定 的 程序 语言 ， 数 组 的 写法 是 有 规定 的 ， 如 FORTRAN 数组 
A(2:5, 7:9)，B(4,3)、C 数组 A[4][3] 等 。 
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素 ， 此 时 惑 没 有 必要 多 次 重复 存储 相同 的 非 去 元 系 或 零 元 素 了 ， 如 对 相同 的 非 零 元 素 只 分 
配 一 个 存储 空间 ， 对 零 元 素 不 分 配 空间 ， 从 而 市 省 存储 空间 。 这 就 是 矩阵 的 压缩 存储 。 
非 零 元 素 或 零 元 素 分 布 具 有 一 定 规律 的 矩阵 称 为 特殊 和 矩 阵 ， 非 零 元 素 个 数 很 少 ( 远 远 
少 于 和 矩阵 元 素 总 数 ) 的 窃 阵 称 为 稀 足 矩阵 。 显 然 ， 秘 芷 矩阵 中 有 大 量 的 去 元 素 。 
矩阵 和 数组 元 素 的 下 标 可 以 从 1 开始 ， 也 可 以 从 0 开始 ， 甚 全 从 其 他 东 个 整数 开始 ， 
由 于 分 析 方 法 类 似 ， 束 不 一 一 加 以 讨论 了 ， 以 下 仅 讨 论 下 标 从 1 开始 的 情况。 


4.3.1 特殊 和 窍 阵 


1 对称 和 矩阵 
若 一 个 nm 阶 方 阵 A[l..n][1..n] 的 元 素 满足 : 
i 1<1, J]<n 


则 称 其 为 n 阶 对 称 矩 阵 。 例 如 图 4.2 就 古 一 个 5 阶 的 对 称 和 矩阵 。 

对 称 和 矩阵 中 的 元 素 关 于 主 对 角 线 对 称 ， 故 可 只 存储 上 三 角 或 下 三 角 中 的 元 素 ， 即 让 每 
两 个 对 称 的 元 素 共享 一 个 存储 空间 。 这 样 可 节约 一 半 左 右 的 存储 空间 。 

对 上 三 角 或 下 三 角 部 分 ， 又 可 按 行 或 按 列 存储 ， 故 对 称 和 矩阵 一 般 有 4 种 不 同 的 存储 方 
式 。 不 失 一 般 性 ， 我 们 讨论 按 行 存储 下 三 角 部 分 ， 其 元 素 存放 次 序 如 图 4.3 所 示 。 


1 4 6 1 2 

4 7 0 8 3 

6 0 3 4 0 

1] 8 4 1 9 

FA | 
图 4.2 ”对 称 和 矩阵 4.3 对称 矩阵 按 行 存放 


在 下 三 角 和 矩阵 中 ， 第 i 行 有 i 个 元 素 ， 故 元 素 总 数 为 1+2+…+n=n(n+1)/2。 因 此 ， 我 们 
可 以 用 一 个 同 量 V[1..n(n+1)/2] 来 存储 下 三 角 和 矩阵 的 所 有 元 素 。 在 这 种 存储 方式 下 ， 为 了 访 
问 原 矩阵 的 元 素 a， 必 须 在 a 和 V[k] 之 间 找 到 对 应 关系 。 

显然 ， 辱 1=]， 则 a 在 下 三 角 和 矩阵 中 。i 之 前 有 二 1 行 ， 其 中 有 1+2+…+(-1)=i(G 一 1)/2 
个 元 素 ， 而 ai 是 第 i1 行 上 的 第 j 个 元 素 ， 因 此 k=i(i-1)/2+j。 

右 ij<j， 则 ai 在 上 三 角 和 矩阵 中 ， 由 于 ai=aix， 只 要 交换 上 述 对 应 关系 式 中 的 1 和 j 即 可 。 
所 以 k 和 1i、j 的 对 应 关系 为 : 

Ee i> j 

0 Da i<j 

有 反之， 对 所 有 的 k=1, 2…, n(n+1)/2， 也 能 确定 VIk] 在 原 和 矩阵 中 对 应 的 位 置 1, ])( 见 习 
题 44)。 即 ai 和 V[k] 之 间 是 一 一 对 应 的 关系。 这 样 ， 我 们 称 问 量 V[1..n(n+1)/2] 为 原 对 称 
矩阵 的 压缩 存储 结构 ， 参 见 图 4.4。 它 将 原来 个 元 素 “ 压 缩 ” 到 了 n(n+1)/2 个 元 素 的 一 
维 数组 中 。 

最 后 ， 如 果 要 求 元 素 ai 的 地 址 ， 则 为 : 

LOC(i, j))=LOC(k)=LOC(1)+(k-1)xc 
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a a az |ail  … |ar| … |am 


IE 2 3 n(n-1) i n(n+1) 
2 
图 4.4 对称 和 矩阵 的 讨 缩 存储 


2. 三 角 德 阵 
若 矩 阵 A[1..n][1.n] 主 对 线 上 方 〈 或 下 方 ) 的 元 素 全 部 相同 ， 均 为 常数 c， 则 称 该 矩阵 
为 下 三 角 和 矩阵 (或 上 三 角 和 矩阵 )， 见 图 4.$。 在 大 多 数 情况 下 ， 常 数 c 为 零 。 


d1 CC *% C all dy 7 al。 
dy dy 7 CLC C dy 7 dn 
a a 3 + 
(a) 下 三 角 和 矩阵 (b) 上 三 角 和 矩阵 


图 4.5 三 角 和 矩阵 
显然 ， 重 复 的 第 数 c 可 只 存储 一 次 ， 其 余 元 素 有 nn+l)/2 个 ， 故 可 将 三 角 和 矩阵 存储 到 


癌 量 V[1.nC+l)/2+1] 中 ， 其 中 第 数 c 存放 在 问 量 的 最 后 一 个 分 量 中 。 这 样 ， 可 下 接 利 用 前 
面 对 称 矩阵 的 结果 。 以 下 三 角 和 矩阵 的 按 行 存储 为 例 ， 元 素 ai 和 V[k] 之 间 的 对 应 关系 为 : 


k =410—D/2+] 1>] 
n(n+1)/2 +1] 1<] 
3. 对 角 和 矩阵 


对 角 和 矩阵 是 指 ， 除 了 主 对 角 线 及 其 邻近 的 上 下 才干 条 次 对 角 线 上 的 元 素 外 ， 其 他 元 素 
均 为 去。 在 对 角 和 矩阵 中 ， 非 零 元 素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 中 《对 角 和 托 阵 是 
带 状 矩 阵 中 的 一 种 )。 图 4.6 (a) 就 是 一 个 三 对 角 和 矩阵 。 

如 果 将 对 角 和 矩阵 的 首 、 末 行 各 补 上 一 个 虚 元 素 , 则 和 窍 阵 每 行 的 非 零 元 素 个 数 就 都 相同 ， 
于 是 很 目 然 地 可 将 对 角 和 矩阵 压 几 到 一 个 二 维 数 组 Boxw 中 ， 这 里 w 为 对 角 线 总 条 数 《〈 市 宽 )。 
对 图 4.6(a) 的 三 对 角 和 矩阵 ， 它 的 二 维 压 颖 结构 见 图 4.6(b)， 元 素 bij, 和 的 对 应 关系 为 : 


pe . l1<1,]<n 
] =j-—i+2 
二 维 数组 还 可 进一步 转化 为 一 维 数 组 。 当 然 ， 也 可 和 直接 在 原 对 角 和 矩阵 上 ， 将 各 非 零 元 


素 按 行 、 按 列 或 按 对 角 线 的 次 序 存储 放 到 一 维 数 组 中 ， 见 图 4.6 (c) 。 

例 4.1 设 有 3 对 角 窍 阵 A[1..n, 1..n]， 现 将 其 3 条 对 角 线 上 的 元 素 按 行 存 于 一 维 数组 
B[1..3n-2] 中 ， 使 得 B[k]=Al[i,j]， 见 图 4.6 (c)。 求 : 

(1) 用 i、j 表示 的 下 标 变 换 公式 。 

(2) 用 k 表 示 1、j 的 下 标 变换 公式 。 

解 : 注意 这 里 没有 补充 虚 元 素 。 对 元 素 ai, 它 之 前 有 二 1 行 , 非 零 元 素 个 数 为 3*(i-1)-1 
(第 一 行 只 有 2 个 非 零 元 素 ); 在 第 i1 行 ， 对 角 线 上 的 元 素 为 ai， 由 于 是 3 对 角 和 矩阵 ， 故 第 
一 个 非 零 元 素 为 ai i 1， 于 是 在 第 1 行 上 从 ai i 到 a， 元素 个 数 为 一 (1)+1 个 ， 所 以 到 元 
素 aii 为 止 矩 阵 中 非 去 元 素 总 数 为 : 

k=[3(i—1)-11+[j-(i~1)+1]=2i+j-2 
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a a 0 0 0 X all al2 
dy dy, 323 > 0 0 dyl a2> dy3 
0 a, a a 0 a a a 
A Ei 32 33 ey B 。 32 33 34 
0 0 0 an 1n 2? a A 1n_ 2 本 an ln 
0 0 0 0 i 二 X 
(a) 三 对 角 和 矩阵 (b) 二 维 压 缩 存 储 
ai | 312 | a1 | 322 | 23 | 32 |ass| … alanmn 
k= 1 p4 3 4 性 6 2 i 2 
(c) 一 维 压 缩 存储 


图 4.6 三 对 角 和 矩阵 及 其 压缩 存储 


但 反 过 来 ， 已 知 k， 不 能 直接 从 上 式 求 出 1 和 j， 因 为 这 里 两 个 未 知 数 只 有 一 个 方程 ， 
还 要 利用 其 他 潜在 条 件 (如 i、j、k 为 整数 等 )。 注 意 到 对 三 对 角 和 矩阵 的 每 一 行 1， 列 号 j 
的 取 值 只 能 是 二 1、i、i+1， 即 二 1<j<it1， 所 以 从 上 式 得 : 

2i+(i—1)-2<k<2i+G+1)-2， 即 31-3<<k<3i1-1， 从 而 (K+1)/3<i<(k+3)/3。 

由 该 式 可 得 k/3<i<k/3+1， 由 于 i 为 整数 ， 所 以 寺 k/34+1%。 

由 上 式 还 可 得 区 +1)/3<i<(k+1)/3+1， 所 以 填 (Kk+1)3 |。 不 难 发 现 ， 这 两 者 是 相等 的 。 

求 出 i 后， 将 它 带 入 上 面 k 的 表达 式 ， 便 可 得 : 

j=k-2i+2=k-2Lk/3」,， 或 j=k+2-2| (Kk+1)/31。 

上 述 的 几 种 特殊 和 矩阵， 其 非 零 元 素 的 分 布 有 规律 可 循 ， 总 能 找到 一 种 方法 将 它们 压缩 
存储 到 一 个 癌 量 中 ， 并 且 能 找到 和 矩阵 中 的 元 素 和 该 问 量 下 标的 对 应 关系 ， 从 而 仍然 可 以 对 
矩阵 元 素 进 行 随机 存 取 。 


4.3.2” 稀 琉 和 矩阵 


在 存储 稀 玖 矩阵 时 ， 为 了 节省 存储 单元 ， 很 自然 的 方法 是 只 存储 非 零 元 素 。 但 非 零 元 
素 的 分 布 一 般 是 没有 规律 的 ， 元 素 的 存储 次 序 无 法 反映 它们 之 间 的 逻辑 关系 ， 所 以 必须 显 
式 地 存储 每 个 元 素 的 行列 逻辑 次 序 。 最 简单 的 方法 是 将 非 零 元 素 的 值 和 它 所 在 的 行 号 、 列 
写作 为 一 个 结 点 存放 在 一 起 , 于 是 矩阵 的 每 一 个 非 零 元 素 束 由 一 个 三 元 组 〈 行 号 , 列 号 ,元 
素 值 ) 唯一 确定 。 显 然 ， 稀 芷 矩阵 的 压缩 存储 会 失去 随机 存 取 功 能 。 

所 有 非 零 元 素 对 应 的 三 元 组 构成 的 集合 就 是 稀 玻 矩阵 的 逻辑 表示 ， 它 有 两 种 常用 的 存 
储 方式 : 三 元 组 表 与 十 字 链 表 。 

1. 三 元 组 表 

将 稀 跑 矩阵 非 零 元 素 的 三 元 组 按 行 序 (或 列 序 ) 的 顺序 排列 ， 则 得 到 一 个 结 点 均 是 三 
元 组 的 线性 表 。 该 线性 表 的 顺序 存储 结构 称 为 稀 朴 和 窍 阵 的 三 元 组 表 。 因 此 ， 三 元 组 表 是 稀 
朴 和 矩阵 的 一 种 顺序 存储 结构 。 在 以 下 讨论 中 ， 假 定 三 元 组 按 行 序 排列 。 


@ La 表示 小 于 等 于 a 的 最 大 整数 ， 即 对 a 取 下 整数 ，| a | 表示 大 于 等 于 a 的 最 小 整数 ， 即 对 a 取 上 整 
数 ， 比 如 L6.x 上 6，| 6.x 上 上 7。 
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nda 这 也 
正 是 黎 世 矩 阵 运算 中 经 冲 需 要 的 。 显 然 ， 要 唯一 确定 稀 牙 窃 阵 ， 还 必须 知道 矩阵 的 行 数 和 
列 数 。 三 元 组 表 的 类 型 说 明 如 下 : 


typedef int datatype; // 和 矩阵 元 素 的 数据 类 型 ， 假 设 为 Int 
const int maxsize=100; // 非 零 元 素 个 数 的 上 限 ， 三 元 组 表 的 容量 
typedef struct 1{ 
Ln // 行 号 、 列 号 
datatype val; / /元 素 值 
} nodetype; // 三 元 组 结 点 类 烈 
typedef struct f{ 
int m,n; // 行 数 、 列 数 
int 七 ; // 当 前 表 长 ， 即 非 零 元 素 个 数 
nodetype data [maxsize];  // 三 元 组 表 
} spmatrix; // 稀 芷 矩阵 类 型 
例如 ， 图 4.7 (a) 的 稀 疏 矩阵 A 对 应 的 三 元 组 表 如 图 4.7 (b) 所 示 ， 其 中 a 是 以 上 定 
义 的 spmatrix 类 型 的 变量 。 


70 0 0 
7 0 08 0 00 -5 0 
0 0 00 1 Bsa=|I0 0 0 0 
“so -5o2 0 80 2 0 
re 1 一 一 一 0 1 0 -1 
(a) 稀 疏 矩阵 A (b)A 的 三 元 组 向 量 a->data 。〔c) 稀疏 矩阵 B=A- ”4d)B 的 三 元 组 同 量 b->data 


图 4.7 稀 玻 算 阵 和 它 的 三 元 组 表 存 储 结 构 


如 果 考 虑 到 C/C++ 语言 数组 下 标 从 0 开始 ， 而 矩阵 行 、 列 号 一 般 从 1 开始 ， 我 们 也 可 
从 数组 的 1 号 单元 开始 存放 非 零 元 素 ， 而 0 号 单元 正好 可 用 来 存放 甜 阵 的 行 数 、 列 数 和 非 
堆 元 素 个 数 。 这 时 上 述 壬 芷 矩阵 的 类 型 定义 以 及 以 后 的 有 关 运 算 需 要 略 作 修改 。 

稀疏 矩阵 三 元 组 表 的 基本 运算 也 是 读 GET(i, j) 和 写 SET(i, j, x)， 实 现时 要 先进 行 行 、 
列 号 的 查找 〈 不 能 随机 存 取 )， 而 在 写 时 ， 三 元 组 表 中 可 能 没有 对 应 元 素 〈 即 该 元 素 原 来 为 
雪 )， 这 时 要 在 三 元 组 表 中 插入 一 个 元 素 ; 如 果 x=0， 则 要 在 三 元 组 表 中 删除 对 应 元 素 〈 寿 
存在 的 话 )。 这 是 因为 三 元 组 表 不 存储 零 元 素 。 有 了 读 写 运算 ， 就 可 以 像 访 问 普通 数组 那样 
访问 三 元 组 数组 了 。 其 他 运算 可 根据 使 用 的 需要 设置 ， 如 矩阵 的 转 置 、 加 法 、 乘 法 等 。 
面 主要 讨论 矩阵 的 转 置 TRANSO 在 三 元 组 表 上 的 实现 。 

矩阵 的 转 置 是 指 将 它 的 行列 互 换 ， 如 一 个 mxn 的 矩阵 A， 转 置 后 得 到 一 个 nxm 的 矩 
阵 B， 则 ADHDIF=BD]DI。 例 如 图 4.7 (a》 中 的 矩阵 A 和 图 4.7(c) 中 的 矩阵 B 互 为 转 置 矩 阵 。 

利用 GET 和 SET 运算， 可 实现 矩阵 的 转 置 : 

for (i1=1;1<=m; 1++) 


for (J]=1;]j<=n; JjJ++) 
下 SEE 1 AGET(L TY)s 
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这 个 算法 虽然 务 单 ,但 效率 不 高 , 其 时 间 复 杂 虐 为 O(mxn); 而 对 黎 惑 年 阵 ,GET、SET 
不 能 对 元 素 随 机 存 取 ， 还 要 增加 得 找 元 和 素 位 置 的 时 间 开 销 ， 效 率 更 低 。 为 了 提高 效率 ， 可 
不 通过 GET 和 SET 而 直接 实现 转 置 。 

如 果 在 转 置 时 简单 地 将 每 个 三 元 组 的 行 号 和 列 号 互 换 ， 则 转 置 后 的 三 元 组 将 不 是 按 行 
序 而 是 按 列 序 排列 的 ， 这 时 需要 对 三 元 组 重新 排序 ， 总 的 时 间 复 杂 度 为 O(t)+O(tlogyt)。 这 
里 ，O(tlog2b 是 基于 比较 运算 的 排序 算法 的 最 好 平均 时 间 复 杂 度 ， 在 简单 排序 〈 如 时 泡 排 
序 等 ) 情况 下 ， 时 间 复 杂 度 可 能 上 升 为 O(t )。 

为 了 降低 时 间 复 杂 上 度 ， 显 然 应 该 设法 避免 单独 的 排序 运算 ， 这 就 需要 在 进行 元 素 行 号 
和 列 号 互 换 的 过 程 中 ， 顺 便 按 行 序 排列 。 有 具体 来 说 ， 一 般 有 两 种 算法 ， 下 面 分 别 介绍 。 

(1) 按 列 序 转 置 ， 顺 序 存放 

注意 到 矩阵 B 的 行 就 是 矩阵 A 的 列 ， 如 果 将 A 的 三 元 组 表 按 列 序 转 置 ， 则 得 到 的 B 
的 三 元 组 表 必 定 按 行 序 排列 。 这 样 ， 可 对 A 的 三 元 组 从 头 到 尾 进 行 扫 朱 ， 分 别 取 出 每 一 列 
上 的 非 零 元 素 ， 将 其 行列 交换 后 ， 依 次 存 入 B 的 三 元 组 中 。 具 体 算法 如 下 : 

Vold trans (spmatrix *A,spmatrix *B) { 

int pa,pb,col; 


B—>m=A—>n; 
B—>n=A—>m; 


B—>t=A—>t; 
if (A->t<1) return; // 没 有 任何 非 零 元 素 
pb=03 / /pb 为 B 中 三 元 组 表 当 前 空位 置 
for (Co1=1;:col<=A->ny;CcolL++) // 对 和 所 有 列 循环 
for (pa=0; pa<A-—>t;pa+t+) // 对 A 三 元 组 循环 ， 奔 找 每 一 列 号 


if (A->data[pal] .j==col) { 
B->data [pb] .i=A—>data[pal .J]; 
B->data [pb] .J]=A->data[pal .i; 
B->data[pb] .val=A—>datalpal .val; 
DOT 
} 
} 


由 于 三 元 组 表 的 元 素 按 行 序 排列 ， 上 述 算 法 在 扫描 A 的 三 元 组 表 时 ,同一 列 上 的 非 零 
元 素 必 然 是 按 行 号 大 小 的 顺序 出 现 的 ， 所 以 转 置 后 的 三 元 组 表 中 行 号 相同 的 元 素 正 好 按 列 
号 排列 。 显 然 ， 算 法 的 时 间 复 杂 度 为 Onaxb。 作 为 对 比 ， 非 压缩 矩阵 转 置 的 时 间 复 杂 度 为 
O(mxn)， 而 一 般 非 零 元 素 个 数 全 > 行 数 m， 所 以 上 述 转 置 算法 的 效率 远 低 于 非 压缩 矩阵 的 
转 置 。 

(2) 按 行 序 转 置 ， 按 列 索引 存放 

上 述 转 置 算 法 要 反复 搜索 三 元 组 表 以 得 找 同 列 元 素 ， 从 而 影响 了 效率 。 如 果 对 和 矩阵 A 
每 一 列 的 第 一 个 非 零 元 素 建 一 个 索引 ， 指 出 它 在 了 的 三 元 组 表 中 的 位 置 ， 并 在 该 列 元 素 存 
放 时 ， 动 态 修改 列 索 引 ， 则 任何 元 素 都 可 按 列 索引 存放 ， 了 驶 不 必 按 列 序 转 置 了 。 

这 里 先 建 工 一 个 列 索引 cpos[1..n]， 其 中 
cpos 思 表示 原 和 矩阵 第 1 列 上 第 1 个 非 零 元 素 在 B 列 1 2 3 4 5 
的 三 元 组 表 中 的 位 置 。 为 了 运算 方便 ， 再 设 一 个 数 。 和 天 数 enum 
组 cnum[1.n]， 其 中 cnumfi] 存 放 诛 矩阵 中 第 1 列 上 
非 零 元 素 的 个 数 。cpos 可 用 下 列 递 推 公式 求 得 : SR 
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cpos[1]=0 
cpos [1i]=cpos[i-1]+cnum[i—1] 2 三 1 夺 n 


例如 ， 对 图 4.7 (a) 所 示 的 矩阵 A，cnum 和 cpos 的 值 如 图 4.8 所 示 〈 最 后 一 列 的 非 零 
元 素 个 数 不 必 求 出 ， 示 用 到 )。 具 体 算法 如 下 : 


void trans2 (spmatrix *A,spmatrix *B) { 
int pa.Db ,Col 
int *cpos,*cnum; 
B—>m=A—>n; 
B—>n=A—>m; 


B—>t=A—>t; 
if (A->t<1) return; // 无 非 零 元 素 
cpos=new int[A->n+1]; / /动态 分 配 辅助 空间 


cnum=new int [A—>n+l1]; 
for (col=1;col<=A—>n;col++) cnuml[lcoll]=0; 
for (Pa=07Ppa<A-> 七 ?Pa++) { 
col=A->data [pal] .]; 
cnum[coll]++; // 累 加 每 列 非 零 元 素 个 数 
} 
cpos[1]=0; 
for (col=2;col<=A—>n; col++) 
cpos[col]=cpos[col-1]+cnum[col-1]; // 递 推 : 每 列 第 一 个 非 零 元 素 在 B 中 的 位 置 
for (pa=0;pa<A—>t;pat++) { 
col=A->data [pal] .]; 
pb=cpos [col1]; // 该 列 在 B 中 开始 位 置 
B->data [pb] .i=A->data [pal] .]:; 
B->data [pb] .J]=A->data[pal] .i; 
B->data[pb] .val=A—>datalpal] .val; 


cpos [col]++:; // 该 列 下 一 个 元 素 在 B 中 位 置 
} 
delete []cpos; / /释放 辅助 数组 空间 


delete [|]cnum; 


} 

算法 的 时 间 复 杂 度 为 O(n+t)， 比 前 一 个 效率 局 得 多 ， 故 这 种 转 置 方 法 又 称快 速 转 置 。 

即使 对 非 黎 下 和 矩阵 ， 该 算法 也 有 意义 ， 因 为 t 接 近 mxn 时 ， 时 间 复 杂 度 变 为 O(mxn)， 
与 不 压 瘦 直接 转 置 的 算法 相当 。 

顺便 指出 ， 该 算法 的 数组 cnum 可 不 单独 设置 ， 而 借用 cpos 的 空间 ,， 即 将 cnumf[i] 存 放 
到 cpos[i+l] 位 置 上 ， 递 推 公 式 改 为 cpos[il=cpos[ 这 1]+cpos[i， 有 具体 算法 略 。 

实际 上 ， 在 秘 朴 矩阵 的 三 元 组 表示 中 ， 我 们 也 可 以 建立 一 个 附加 的 行 索引 ， 称 为 市 行 
(索引 ) 表 的 三 元 组 表 。 这样 可 以 比较 方便 地 找到 茶 一 行 的 第 一 个 非 零 元 素 以 及 该 行 非 零 元 
素 的 个 数 ， 其 原理 与 上 面 建 列 索引 类 似 。 

2. 十 字 链 表 

壬 芷 矩阵 非 去 元 素 的 位 置 和 个 数 可 能 会 经 钊 发 生变 化 ， 如 窍 阵 相 加 A=A+B， 在 A 中 
就 可 能 出 现 新 的 非 零 元素， 或 原来 的 非 堆 元 素 变 成 了 和 去 元 素 ， 这 恕 涉及 结 点 的 插入 和 删除 
运算 。 三 元 组 表 是 一 种 顺序 存储 方法 ， 对 插入 和 删除 运算 是 不 合适 的 ， 因 为 会 引起 大 量 结 
点 的 移动 ， 此 时 采用 链 式 存储 结构 就 比较 合适 。 

壬 足 定 阵 弟 用 的 链 式 存储 结构 是 十 衬 链 表 。 不 过 ， 十 字 链 表 的 应 用 远 不 止 壬 牙 定 阵 ， 
一 切 具 有 正 交 关系 的 结构 ， 都 可 采用 十 和 学 链表 这 种 存储 结构 。 

在 十 字 链 表 中 ， 每 个 结 点 除了 存放 非 去 元 素 的 三 元 组 外 ， 还 增加 了 行 、 列 两 个 指针 : 
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行 指针 用 来 指 加 本 行 中 的 下 一 个 非 零 元 素 ， 列 指针 用 来 指 回 本 列 中 的 下 一 个 非 去 元 素 。 即 
通过 行 指针 将 同一 行 上 的 非 零 元 素 链接 在 一 起 ， 通 过 列 指针 将 同一 列 上 的 非 去 元 系 链 接 在 


一 起 。 因 此 ， 每 一 个 非 零 元 素 ai 既是 第 1 行 链表 上 的 一 个 结 点 ， 又 是 第 ] 列 链表 上 的 一 个 
结 点 ， 就 好 像 处 在 一 个 十 字 路 口上 ， 故 称 这 样 的 链表 为 十 字 链 表 或 正 交 链表 。 这 是 一 种 多 
重 链表 结构 。 


显然 ， 如 果 只 有 行 链表 (或 列 链表 ) 也 可 用 来 表示 黎 焉 是 阵 ， 这 样 昌 可 区 省 一 定 的 空 
间 ， 但 如 果 要 找 同一 列 〈 或 同一 行 ) 上 的 非 零 元 素 就 不 如 十 字 链 表 方 便 了 。 

十 字 链 表 的 结 点 结构 见 图 4.9 (a)， 其 中 各 字段 的 含义 为 : 

e。 1、j、val 一 一 非 堆 元 素 的 行 号 、 列 号 和 元 素 值 。 

。 down -一 -一列 指 针 ， 指 回 同 列 中 下 一 个 非 零 元 素 结 点 。 

。 Tright 一 一 行 指针 ， 指 问 同 行 中 下 一 个 非 零 元 素 结 点 。 

十 学 链表 的 类 型 定义 如 下 : 

typedef int datatype; / /矩阵 元 素 的 数据 类 型 ， 假 设 为 Int 


typedef struct node * pointer; // 链 表 结 点 指针 类 型 
struct node { 


工本 1 1 
datatype val; 
pointer down,right; // 列 指针 和 行 指 针 
}; 
typedef pointer xlink; // 十 字 链 表 头 指针 类 型 
| val 未 用 | 未 用 | next mlnlt 
_down | right _down | right | 
(a) 非 零 元 素 结 点 (b) 行 /列表 头 结 点 (c) 总 表 头 结 点 
图 4.9 十 字 链 表 的 三 种 结 点 类 型 
为 了 运算 方便 ， 对 每 一 个 行 链表 和 列 链表 都 增加 一 个 头绪 点 ， 头 结 点 的 行 、 列 域 未 用 


(但 可 用 来 存放 本 行 或 本 列 中 的 非 零 元 素 个 数 ， 见 图 4.9(b))。 例 如， 图 4.7 (a) 所 示 黎 芷 
年 阵 A 的 十 字 链 表 如 图 4.10 所 示 。 

由 图 4.10 可 见 ， 每 个 列 链表 的 头 结 点 ， 只 用 列 指针 down 指 癌 本 列 中 的 第 一 个 非 去 元 
素 ; 每 个 行 链表 的 头 结 点 ， 只 用 行 指针 right 指向 本 行 中 的 第 一 个 非 零 元 素 ; 这样 ， 两 组 表 
头 结 点 可 以 合用 ， 即 第 1 行 链表 和 第 1 列 链表 共享 一 个 表 头 结 上 点 于， 以 节省 存储 空间 。 

所 有 的 头 结 点 组 织 成 头 结 点 数组 ， 当 下 标 从 1 开始 使 用 时 ， 数 组 大 小 为 1Hmax(m, n)， 
这 时 去 号 单元 的 三 元 组 可 用 来 存放 和 窍 阵 的 行 数 、 列 数 、 非 零 元 素 的 个 数 等 总 体 信 息 ， 该 单 
元 相当 于 总 表 头 结 点 〈( 见 图 4.9 〈c))。 

也 可 把 所 有 的 头 结 点 组 织 成 链表 ， 这 在 矩阵 的 大 小 有 变化 时 比较 有 利 ， 但 找 茶 行 或 茶 
列 的 头 结 点 时 则 需要 在 链表 中 搜索 。 

十 字 链 表 上 的 基本 运算 ， 除 了 数组 的 读 和 写 之 外 ， 还 有 链表 本 身 的 一 些 运 算 ， 如 初始 
化 、 插 入 、 删 除 等 ， 这 里 只 就 运算 的 一 些 基 本 方法 进行 说 明 。 

(1) 初始 化 

生成 m 行 a 列 窍 阵 的 空 十 字 链 表 ， 这 时 只 有 头 结 点 。 动 态 申 请 大 小 为 1Hmax(m，m) 的 
头 结 点 数组 ，0 与 单元 的 三 元 组 内 存放 矩阵 的 行 数 m、 列 数 n、 非 云 元素 的 个 数 0。 
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图 4.10 稀 跑 和 矩阵 A 的 十 字 链 表 
(2) 插入 
插入 新 结 点 时 ， 分 别 在 相应 的 行 、 列 两 个 链表 中 插入 。 
(3) 删除 
删除 结 点 时 ， 分 别 在 相应 的 行 、 列 两 个 链表 中 删除 。 
(4) 证 GET 
GET 运算 实现 按 数组 方式 访问 十 字 链 表 ， 即 已 知行 号 和 列 号 求 出 元 素 值 或 结 点 的 地 
址 。 方 法 是 搜索 对 应 的 行 链表 ， 查 找 列 号 为 给 定 列 号 的 结 点 (或 搜索 对 应 的 列 链表 ， 查 找 
行 号 为 给 定 行 号 的 结 点 )。 
($5) 与 SET 


SET 运算 实现 按 数 组 方式 给 元 素 赋 值 ， 即 已 知行 号 和 列 和 号， 给 对 应 的 元 素 赋 值 。 与 
GET 类 似 ， 需 要 先 按 给 定 的 行 号 或 列 号 查找 对 应 的 元 素 。 如 果 查 找到 了 ， 就 对 其 赋值 ， 但 
当 赋 零 值 时 应 删除 对 应 的 结 点 ， 夺 僵 找 不 到 ， 则 要 插入 一 个 新 结 点 。 

有 了 基本 运算 ， 如 可 以 完成 十 季 链 表 的 其 他 运算 了 ， 如 建 表 。 显 然 ， 它 由 两 步 完成 : 
先 建 一 个 空 表 ,， 这 通过 初始 化 完成 ; 然后 依次 输入 各 个 三 元 组 ,将 它们 插入 到 十 字 链 表 中 ， 
这 可 通过 插入 算法 完成 。 

以 上 三 元 组 表 、 十 字 链 表 中 非 零 元 素 的 存储 信息 为 三 元 组 〈 行 号 , 列 号 , 值 )， 也 可 存 
储 为 二 元 组 〈 数 组 元 素 按 行 或 按 列 排列 时 的 序号 , 值 )， 以 后 要 用 行 号 和 列 号 时 再 通过 排列 
关系 计算 出 来 。 这 样 压缩 了 行 、 列 信息 的 储存 空间 ， 但 增加 了 以 后 使 用 的 时 间 。 


4.4 广义 表 


4.4.1 广义 表 的 基本 概念 
广义 表 (Generalized List) 又 称 列 表 Lists"， 是 n Cn=0) 个 元 素 a1, aa，…, an 的 有 限 序 


(D 这 里 用 复数 形式 以 区 分 一 般 的 表 (list)。 
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列 ， 其 中 ai 或 者 是 原子 或 者 是 一 个 广义 表 ， 通 利 记 为 LS=(al, aa，…, an)。 这 是 一 个 递归 定 
义 。 夺 ai 本 喘 也 是 一 个 广义 表 ， 则 称 它 为 LS 的 子 表 。LS 中 元 素 ai 的 个 数 〈 不 计 gai 的 内 部 
结构 ) 称 为 LS 的 长 度 。 不 舍 任 何 元 素 〈 长 上 度 为 0) 的 表 称 为 空 

可 见 ， 在 不 考虑 元 素 ai 的 内 部 结构 ， 则 广义 表 LS 融 是 一 个 线性 表 ， 可 看 作 线 性 表 的 
推广 。 反 过 来 说 ， 线 性 表 就 是 不 合子 表 的 广义 表 。 

对 非 空 广义 琢 ， 它 的 第 1 个 元 素 称 为 表 头 ， 除 去 表 头 后 其 余 元 素 构 成 的 表 称 为 表 尾 。 
显然 ， 表 尾 一 定 是 子 表 ， 但 表 尖 可 以 是 原子 ， 也 可 以 是 子 表 。 

将 广义 表 展开 后 所 含 插 写 的 最 大 骨 僚 层 数 称 为 深度 。 

广义 表 的 成 员 可 以 为 子 表 ， 子 表 的 成 员 又 可 以 是 子 表 ，…… ， 这 使 得 广义 表 呈 现 出 多 
层次 性 和 多 样 性 。 如 果 允 许 广 义 表 的 茶 成 员 内 含有 广义 表 目 己 ， 则 称 此 广义 表 为 递归 表 。 
在 广义 表 中 ， 杀 个 成 员 (原子 或 子 表 ) 可 能 出 现 多 次 , 但 每 次 出 现 应 代表 的 是 同一 个 目标 ， 
或 者 说 是 对 同一 目标 的 共 圣 。 人 允许 元 素 共 至 的 广义 表 称 为 再 入 表 (Reentrant List)。 如 末 表 
中 没有 共享 和 递归 的 成 分 ， 即 没有 任何 成 分 出 现 多 次 ， 则 称 此 广义 表 为 纯 表 (Pure List)。 


各 种 表 之 间 的 关系 为 : 
线性 表 C 纯 表 c 再 入 表 C 递归 表 


在 书写 上 ， 为 了 区 分 原子 和 广义 表 ， 一 般 用 大 写字 母 表 示 广 义 表 ， 用 小 写字 母 代表 原 
子 。 下 面 给 出 几 个 广义 表 的 例子 。 

A=(0: 空 表 ， 无 表 头 ， 无 表 尾 ， 长 度 为 0， 深度 为 1。 注意 ， 空 表 无 表 头 也 无 表 尾 。 

B=(A)=(( )): 表 头 为 ()， 表 尾 为 ()， 长 度 为 1， 深度 为 2。 这 里 表 头 和 表 尾 都 为 空 表 。 

C=(a,b): 表 头 为 a， 表 尾 为 )， 长 度 为 2， 深度 为 1。 这 是 个 线性 表 。 

D=(C, x)=((a, b), x): 表 头 为 (a, b)， 表 尾 为 (x)， 长 度 为 2， 深 度 为 2。 

=(y, D)=(y, (C, x))=(y, ((a, b), x)): 表 头 为 Y， 表 尾 为 (D)， 长 度 为 2， 深度 为 3。 

F=(C, D)=((a, b), ((a, b), x)): 表 头 为 C， 表 尾 为 (D)， 长 度 为 2， 深度 为 3。 这 是 再 入 表 。 

G=(z, G))=(z, (z, (z, (…)))): 表 头 为 z， 表 尾 为 (G)， 长 度 为 2， 深度 为 ce 。 这 是 递归 表 。 

有 了 时， 为 了 强调 广义 表 名 称 ， 可 将 表 名 写 在 表 的 左 括号 前 面 ， 如 上 面 各 表 可 写 为 : 

A( ) 

B(A( )) 

Cl(a, b) 

D(C(a, b)., x) 

E(y, D(C(a, b), x)) 

F(C(a, b), D(C(a, b), x)) 

G(z, G(z, G(***))) 

广义 表 可 用 图 形 形 象 地 表示 ， 图 4.11 给 出 了 上 面 几 个 广义 表 的 图 形 表示 ， 其 中 分 支 结 
点 对 应 广义 表 ， 非 分 文 结 点 《〈 即 叶子) 对 应 原子 或 空 表 。 如 果 与 以 后 我 们 将 要 介绍 的 树 、 
图 等 内 容 联系 起 来 ， 不 难看 到 ， 没 有 共享 和 递归 成 分 的 纯 表 (a) 一 〈e) 相当 于 树 形 结构 ; 
有 共享 成 分 的 再 入 表 (f) 相当 于 有 向 无 环 图 (DAG); 有 递归 成 分 的 递归 表 〈g) 相当 于 有 
回路 的 有 问 图 。 


1 数据 结构 教程 与 题解 


从 
内 5 只 只 
~ AL。 fo @ » 


(a) A=0 (b) B=(A) (c) C=(ab) (d) D=(Cx) (e) E=(y,D) (f) F=(C,D) (g) G=(z,G) 
图 4.11 广义 表 的 图 形 表示 


这 样 看 来 , 广义 表 不 仅 是 线性 表 的 推广 , 也 是 树 的 推广 。 由 于 广义 表 的 元 素 可 以 递归 ， 
使 得 广义 表 具 有 很 强 的 表达 能 力 ， 这 是 广义 表 最 重要 的 特性 。 

广义 表 的 基本 运算 ， 除 包括 线性 表 的 基本 运算 外 ， 还 有 求 深 度 、 求 表 头 、 求 表 尾 、 求 
成 员 、 历 等 。 这 些 运 算 中 大 部 分 与 对 应 的 线性 表 、 树 或 图 的 运算 类 似 ， 只 有 求 表 头 和 表 
尾 是 广义 表 特 有 的 运算 。 著 名 的 人 工 智能 语言 LISP 就 是 以 广义 表 为 数据 结构 的 ， 其 中 就 
连 程序 也 表示 为 一 系列 的 广义 表 ， 通 过 求 表 头 和 表 尾 来 实现 有 关 运 算 。 

例 4.2 ” 试 通过 取 表 头 head(LS) 和 取 表 尾 tail(LS) 运 算 ， 从 广义 表 A=(x, (a, b), y) 中 取出 
原子 b。 

解 : 在 广义 表 中 取 茶 个 元 素 ， 需 要 将 该 元 素 所 在 的 子 表 逐 步 分 离 出 来 ， 直 到 所 求 的 元 
素 成 为 某 个 子 表 的 表 头 ， 上 再 用 取 表 头 运算 取出 。 注 意 ， 最 终 取 出 某 个 元 素 时 ， 不 能 是 取 表 
尾 ， 因 为 它 得 到 的 是 该 元 素 组 成 的 子 表 ， 而 不 是 元 素 本 喘 。 本 例 的 运算 过 程 为 : 

(1) 取 表 尾 tail(A): 得 到 B=((a, b), y)。 

(2) 取 表 头 head(B): 得 到 C=(a, b)。 

(3) 取 表 尾 taill(C): 得 到 D=(b)。 

(4) 取 表 头 head(D): 得 到 b。 

总 的 过 程 为 : head(tail(head(tail(A))))。 


4.4.2 广义 表 的 储存 结构 


广义 表 的 成 员 可 以 是 原子 , 也 可 以 是 子 表 , 它们 结构 不 同 , 难以 用 顺序 存储 结构 表示 ， 
一 般 采 用 链 式 存储 结构 ， 其 中 有 两 种 结构 的 结 点 : 表 结 点 和 原子 结 点 ， 它 们 一 般 通 过 设 标 
志 位 来 区 分 。 下 面 介 绍 广义 表 的 两 种 链 式 存储 结构 。 

1. 头 尾 链表 


基本 思想 是 把 广义 表 不 断 分 成 表 头 和 表 尾 。 表 结 点 包含 三 个 域 : 标志 域 、 表 头 指针 域 
和 表 尾 指针 域 ， 原 子 结 点 包含 两 个 域 : 标志 域 和 值 域 。 结 点 结构 为 : 


设 广义 表 G=(a, ( ), ((b, c), d))， 其 头 尾 链表 表示 如 图 4.12 所 示 。 
2. 扩展 线性 链表 
基本 思想 是 把 广义 表 看 成 由 大 干 元 素 组 成 的 “线性 表 ”， 其 中 大 菜 元 素 为 于 表 ， 则 再 
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建立 该 子 表 的 “线性 表 ”。 上 所 有 结 点 都 包含 三 个 域 : 标志 域 、 值 域 或 表 头 指针 域 、 后 继 指针 
域 ， 具 体 结 点 结构 为 : 
EH- 


图 4.12 广义 表 的 头 尾 链表 表示 示意 图 


原子 结 点 : [tag=0 | data | next_ 
仍 设 三 义 表 G=(a,( ), ((b, 0), qd))， 其 扩展 线性 链表 表示 如 图 4.13 所 未 。 


G 
EDITESDET 
oldi|^ 
0lb|=*|0| c I^ 


图 4.13 广义 表 的 扩展 线性 链表 表示 示意 图 


有 了 储存 结构 ， 就 可 实现 具体 的 运算 。 以 扩展 线性 链表 为 例 ，(1) 求 长 度 时 ， 就 是 求 
相应 的 同 层 结 点 所 构成 的 单 链表 的 长 度 ; (2) 求 深度 时 ， 就 是 各 元 素 “ 深 度 ” 中 的 最 大 值 
+1， 元 素 的 深度 定义 是 : 若 其 为 空 表 则 为 1， 若 为 原子 则 为 0， 否则 为 子 表 ， 则 递归 处 理 ; 
(3) 建 表 时 ， 先 建立 表 头 指针 工 ， 然 后 根据 输入 的 字符 : 左 括号 、 喜 号 、 字 母 、 空 表 符 〈 如 
约定 为 “;”)， 右 括号 、 输 入 结束 符 〈( 如 约定 为 “#”) 等 ， 确 定 属于 子 表 、 腺 子 、 空 表 还 是 
结束 标志 ， 然 后 决定 是 否 建 立 子 表 的 表 头 指针 等 ; (4) 遍历 时 ， 沿 单 链 表 搜 索 ， 若 是 原子 


则 访问 结 点 〈 如 输出 内 容 )， 若 是 子 表 ， 则 递归 处 理 。 具 体 算法 略 。 
站 题 四 


4.1 设 有 三 维 数组 A[-1..0][1..2][3..4]， 请 分 别 按 行 序 和 列 序列 出 各 元 素 。 

4.2 对 一 般 三 维 数组 A[r1..r2][s1..s2][t1..t2]， 分 别 计算 元 素 Arrj[s][ 的 按 行 存 储 与 按 
列 存 储 的 地 址 〈 设 每 个 元 素 占 c 个 单元 )。 

4.3” 设 上 三 角 佐 阵 A[1..n][1..n] 按 行 存放 在 数组 B[1..m](m 是 够 大 ), 使 得 B[k]=A[iD]。 
试 推导 k 和 1i、j 的 关系 。 
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4.4” 设 对 称 和 矩阵 A[1..n][1..n] 按 行 序 将 下 三 角 存 储 在 一 维 数组 B[1..n(n+1)/2] 中 ， 试 推 
导 元 素 B[k] 在 原 矩 阵 A 中 对 应 的 行 号 与 列 号 。 

4.5 设 黎 芷 息 阵 A 以 三 元 组 表 存 放 ， 编 一 算法 求 元 素 A[ilD]。 

4.6 设 A、B 两 个 黎 牙 扎 阵 用 三 元 组 表 表 示 ， 编 写 算 法 ， 计 算 AxB、A+B。 

47 设 A、B 两 个 对 称 定 阵 按 行 存储 下 三 角 ， 编 写 算 法 ， 计 算 AxB、A+B。 

4.8 设 A、B 两 个 普通 矩阵 按 行 存储 ， 编 与 算法 ， 按 一 维 数组 寻 址 公式 计算 AxB、 
AT+B。 

4.9 ”与 一 个 将 用 十 字 链 表 存 储 的 稀 芷 矩阵 转 置 的 程序 。 

4.10 通过 取 表 头 head0 和 取 表 尾 tail0 运 算 ， 取 出 下 表 的 here: 

L=(this, (there, (the, here), where), which, what) 
4.11 写 出 上 题 广 义 表 的 长 度 、 深 上 度 、 表 头 、 表 尾 。 


树 形 结构 | 


树 形 结构 是 一 种 十 分 重要 的 非 线性 结构 ， 可 描述 数据 元 素 间 一 对 多 的 旬 辑 关系 ， 其 结 
点 之 间 形 成 分 文 和 层次 关系， 类 似 于 目 然 界 中 的 树 。 在 客观 世界 中 ， 有 许多 事物 本 喘 束 呈 
现 树 形 结构 ， 如 家 族 关 系 、 部 门 机 构 设置 等 ， 用 树 来 表示 残 非 闻 简便 ， 也 非 党 形象 和 目 然 。 
男 外 ， 有 些 算法 ， 也 营 第 要 借助 树 形 结构 来 解决 。 

本 章 介绍 树 形 结构 中 树 、 森 林 、 二 又 树 等 的 基本 内 容 *“ 并 列举 一 些 简单 应 用 ， 重 点 是 
二 叉 树 。 在 后 面 儿 章 中 ， 还 会 涉及 到 树 和 二 又 树 的 一 些 其 他 应 用 。 


.1 树 的 概念 


在 现实 世界 中 ， 有 很 多 问题 可 用 树 形 结构 来 指 述 。 如 一 个 和 零 部 件 的 组 成 束 可 以 很 目 然 
地 表示 成 一 个 树 形 结构 。 图 5.1 表示 的 束 是 条 眼 标 占 的 组 成 : 它 由 电路 和 机 械 两 大 部 分 组 
成 ; 前 者 由 接口 、 按 键 检测 、 滚 轮 检测 和 主 电路 组 成 ;后 者 由 滩 轮 、 按 键 、 壳 体 等 组 成 。 
这 类 图 形 看 上 去 就 像 一 棵 倒 务 的 树 ,“ 树 形 结构 ” 即 由 此 得 名 。 
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5.1 鼠标 器 的 组 成 示意 图 


图 5.1 可 分 解 为 三 个 部 分 : 鼠标 占 本 映 、 电 路 组 成 、 机 械 组 成 ， 如 图 中 虚线 所 示 。 而 
电路 组 成 和 机 械 组 成 还 可 进行 类 似 的 分 解 。 分 解 出 的 小 组 成 部 分 仍然 保持 看 树 形 结构 ， 下 
到 每 部 分 只 有 一 个 结 点 为 止 。 这 一 特点 是 一 切 树 形 结构 都 具备 的 。 从 所 有 类 似 的 问题 可 抽 
象 出 树 的 递归 定义 。 


(WD 树 形 结构 中 的 一 些 本 语 或 名 称 在 不 同文 献 中 可 能 有 较 大 差异 ， 如 同一 个 概念 可 能 名 称 不 同 ， 而 同 
一 个 名 称 也 可 能 含义 不 同 ， 需 要 注意 。 
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树 (Tree) 是 n (n=0”) 个 结 点 的 有 限 集合 T， 它 或 者 为 空 (n=0)， 或 者 满足 以 下 
条 件 : 

(1) 有 且 仅 有 一 个 特定 的 称 为 根 (Root) 的 结 点 。 

(2) 其 余 结 点 分 为 m (m=0) 个 互 不 相交 的 子 集 Ti, Ts,…, Tm， 其 中 每 个 子 集 又 是 一 
棵 树 ， 称 其 为 根 的 子 树 (Subtree)。 

从 该 定义 知 ， 只 有 一 个 结 点 的 集合 是 一 棵 树 ， 该 结 点 就 是 根 ， 它 无 子 树 。 如 果 集 合 中 
元 素 个 数 大 于 1， 则 它 人 至少 含 有 一 棵 子 树 。 

在 树 的 树 形 图 表示 中 ， 结 点 一 般 用 圆圈 表示 ， 结 点 的 名 字 写 在 圆圈 芳 边 ， 有 时 也 写 在 


加 痢 内 。 除 了 树 形 表 示 法 外 ， 在 不 同 的 应 用 场合 ， 树 还 可 有 其 他 表示 法 。 如 图 5.2 〈a) 所 
示 的 树 还 可 用 图 5.2 (b)、(c) 和 (d) 来 表示 ， 其 中 (b) 用 的 是 止 入 表示 法 ， 类 似 于 书 的 
目录 ， 适 合 文本 模式 下 树 的 屏 医 显示 和 打印 输出 ;(c) 采用 的 是 骨 套 集合 表示 法 ， 利 用 集 
合 的 包含 天 系 来 描述 ， 树 根 所 在 的 集合 最 大 ; (d) 采用 的 是 广义 表 表 示 法 。 


B 
E rm 
F i 
| 
J 一 一 (A(B(E,F(1,J)),C,D(G,H))) 
GC 
D 
区 
Ho 
(a) 树 形 表 示 法 ”(b) 凹 入 表示 法 (c) 媒 套 集合 表示 法 (d) 广义 表 表示 法 


图 5.2 树 形 结构 的 表示 示意 图 


另外 ， 在 日 常 工 作 中 表示 事物 的 分 类 和 组 成 时 ， 也 常 将 图 5.2(a) 的 树 形 表示 法 转动 
90” 使 用 ， 例 如 图 5.3 对 C/C++ 语言 数据 类 型 的 分 类 表示 。 


signed 


沸 符号 型 signed short 
Sit | signed long 
in 


unsigned 
无 符号 整 型 | usoa short 

字符 型 char unsigned long 

和 | 单 精度 float 

本 双 精 度 double 

枚 举 类 型 enum 


数组 类 型 
jae 构 类 型 struct 
共用 类 型 union 
指针 类 型 
空 类 型 void 


基本 类 型 


数据 类 型 


5.3 C/C++ 语言 数据 类 型 


CD 有 的 文献 只 允许 n>0， 即 没有 空 树 的 概念 。 


一 个 结 点 的 子 树 个 数 称 为 该 结 点 的 度 (Degree)。 一 棵 树 的 度 是 指 该 树 中 结 点 的 最 大 度 
数 。 度 为 的 树 也 称 为 k 叉 树 ， 它 的 每 个 结 点 最 多 有 k 个 子 树 。 度 为 零 的 结 点 称 为 叶子 
(Leaf)、 叶 结 点 或 终 痛 结 点 。 度 不 为 零 的 结 点 称 为 分 文 结 点 或 非 终 痛 结 点 ， 除 根 结 点 之 外 
的 分 文 结 点 统称 为 内 部 结 点 ， 根 结 点 也 称 为 开始 结 点 。 

树 中 某 个 结 点 的 子 树 之 根 称 为 该 结 点 的 孩子 (Child) 或 儿子 ， 相 应 地 ， 该 结 点 称 为 孩 
子 的 双亲 (Parents) 或 父 杀 。 同 双 杀 的 孩子 互 称 为 兄弟 (Brother 或 Sibling )。 双 杀 是 兄 第 
关系 的 结 点 称 为 堂 兄 弟 。 

右 树 中 存在 一 个 结 点 序列 {k k2,，…, kj}， 使 得 k; 是 ka 的 双 杀 ， 则 称 这 个 结 点 序列 为 
从 ki 到 ;的 一 条 路 径 (Path) 或 道路 ， 或 称 从 ki 到 k; 有 路 人 符 。 足 人 径 中 边 ( 即 连接 两 个 结 点 
的 线段 ) 的 个 数 称 为 路 径 长 度 。 路 径 中 的 结 点 序列 “ 目 上 而 下 ”地 通过 路 径 上 的 各 边 。 寿 
树 中 结 点 k 到 ks 有 路 径 ， 则 称 k 是 ks 的 祖先 (Ancestor)，ks 是 kk 的 子孙 (Descendant)。 

结 点 的 层 数 (Level) 是 从 根 开始 算 起 的 ， 根 为 第 1 层 "， 其 他 结 点 的 层 数 为 其 双亲 的 
层 数 加 1。 树 中 结 点 的 最 大 层 数 ， 称 为 树 的 高 度 (Height) 或 深度 (Depth )。 

右 树 中 每 个 结 点 的 各 子 树 从 左 到 右 是 有 次 序 的 〈 即 位置 不 能 互 换 ， 否 则 互 换 后 认为 是 
不 同 的 树 )， 则 称 该 树 为 有 序 树 (Ordered Tree); 否则 称 为 无 序 树 (Unordered Tree )。 

右 两 棵 树 中 ， 各 结 点 对 应 相等 ， 对 应 结 点 的 相关 关系 也 对 应 相等 ， 则 称 这 两 标 树 相等 
(等 价 ); 大 两 棵 树 中 ， 运 当地 重 命名 其 中 一 棵 中 的 结 点 ， 可 以 使 两 者 相等 ， 则 称 这 两 棵 树 
同 构 。 

森林 (Forest) 是 m (Cm=0) 标 互 不 相交 的 树 的 集合 。 显 然 ， 删 去 一 棵 树 的 根 ， 吏 得 


到 一 个 森林 ; 反之 ， 加 上 一 个 结 点 作 树 根 ， 和 森林 就 变 为 一 棵 树 。 

树 形 结构 的 逻辑 特 征 可 用 结 点 之 间 的 父子 关系 来 换 述 : 树 中 任 一 结 点 都 可 有 雪 个 或 多 
个 直接 后 继 〈 即 孩子 )， 但 最 多 只 能 有 一 个 直接 前 趋 ( 即 双亲 )。 树 中 只 有 根 无 前 趋 ( 故 称 
开始 结 点 )， 叶 子 无 后 继 〈 故 称 终端 结 点 )。 显 然 ， 父 子 关 系 是 非 线 性 的 。 祖 先 与 子孙 的 关 
系 是 父子 关系 的 延伸 。 

树 的 基本 运算 有 以 下 6 种 。 

(1) 初始 化 INITIATE(T): 置 工 为 空 树 。 

(2) 求 双亲 PARENT(T, x): 求 树 工 中 结 点 X 的 双亲 结 点 。 若 结 点 x 是 树 T 的 根 结 点 或 
结 点 x 不 在 树 T 中 ， 则 函数 值 为 “ 空 ”。 

(3) 求 孩 子 CHILD(T, x, D: 求 树 TT 中 结 点 x 的 第 i 个 孩子 结 点 。 若 结 点 xx 是 树 工 的 叶 
子 或 无 第 i 个 孩子 或 结 点 x 不 在 树 T 中 ， 则 函数 值 为 “ 空 ”。 

(4) 插 枝 INSERT(T, x, i, Y): 将 以 结 点 了 为 根 的 树 置 为 树 T 了 中 结 点 x 的 第 1 棵 子 树 。 
若 原 树 TT 中 无 结 点 x 或 结 点 x 的 子 树 个 数 <i-1， 则 空 操作 。 

(5) 剪 枝 DELETE(T x, ij): 删除 树 工 中 结 点 Xx 的 第 i1 棵 子 树 。 若 树 T 中 无 结 点 x 或 结 
点 xX 的 子 树 个 数 少 于 1， 则 空 操作 。 

(6) 遍历 TRAVERSE(T): 按 某 种 次 序 对 树 中 每 个 结 点 访问 一 次 且 仅 访问 一 次 。 


在 实际 应 用 中 ， 可 根据 需要 对 这 些 基本 运算 进行 适当 增 减 ， 如 增加 求 根 、 求 右 兄 第 、 


G 有 的 文献 层 数 从 0 开始 计算 ， 这 时 深度 和 /或 蝇 度 仍 指 最 大 层 数 ， 或 最 大 层 数 +1。 
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建树 、 碍 找 和 删除 结 点 等 运算 。 


62 二 叉 树 


二 又 树 是 树 形 结构 的 一 个 重要 类型 ， 它 的 存储 结构 和 算法 部 比较 简便 ， 特 别 适 合 于 计 
算 机 处 理 。 即 使 一 般 形 式 的 树 也 可 简单 地 转换 为 二 又 树 ， 绸 进行 相应 的 处 理 。 押 以 二 又 树 
显得 特别 重要 。 


5.2.1 二 义 树 的 概念 
二 义 树 (Binary Tree) 是 n Cn=0) 个 结 点 的 有 限 集 ， 它 或 者 为 衬 Cn=0)， 或 者 由 一 个 


根 结 点 及 两 柠 互 不 相交 的 、 分 别称 作 该 根 的 左 子 树 和 右 子 树 的 二 又 树 组 成 。 这 是 个 递归 定 
义 。 由 于 二 又 树 本 上身 及 子 二 叉 树 都 可 为 空 ， 故 二 叉 树 有 $ 种 形态 ， 如 图 5.4 所 示 。 


"A A 


(a) 空 (b) 只 含 根 (c) 右 子 树 为 空 (d) 左 子 树 为 空 (e) 左右 子 树 均 非 空 
5.4 二 义 树 的 5 种 基本 形态 
在 二 义 树 中 ， 每 个 结 点 最 多 只 能 有 两 棵 子 树 ， 并 且 有 左右 之 分 ， 显 然 它 不 是 无 序 树 。 


但 它 与 度 为 2 的 有 序 树 也 不 同 。 因 为 有 序 树 的 孩子 之 间 虽 然 有 左右 之 分 ， 但 大 只 有 一 个 孩 
子 ， 则 不 分 左右 ; 而 二 又 树 即使 只 有 一 个 孩子 ， 也 要 严格 区 分 左右 。 可 见 ， 二 又 树 既 不 是 
树 的 特殊 情形 ， 也 不 是 有 序 树 的 特殊 情形 。 

例如 ， 图 5.5 是 三 柠 不 同 的 二 又 树 ， 它 们 与 图 5.6 的 普通 树 (有 序 或 无 序 ) 相似 ， 但 
个 等 同 。 如 果 将 这 4 检 树 都 看 成 普通 树 ， 则 它们 就 相同 了 。 


< Pa 办 > 


图 5.5 三 棵 不 同 的 二 又 树 图 5.6 一 棵 普通 树 


和 树 类 似 ， 二 又 树 的 基本 运算 有 以 下 6 种 。 

(1) 初始 化 INITIATE(BT): 加 工 型 运算 ， 建 立 一 棵 空 二 又 树 BT。 

(2) 求 双 杀 PARENT(BT, x): 引用 型 运算 ， 求 二 叉 树 BT 中 结 点 x 的 双亲。 夺 结 点 x 
是 二 又 树 BT 的 根 或 二 又 树 BT 中 无 此 结 点 ， 则 函数 值 为 “ 空 ”。 

(3) 求 左 孩子 LCHILD(BT, x) 及 右 孩 子 RCHILD(BT, x): 引用 型 运算 ， 分 别 求 二 又 树 
BT 中 结 点 x 的 左 孩 子 及 右 孩 子 。 奋 X 为 叶子 或 x 不 在 二 又 树 BT 中 ， 则 函数 值 为 “ 空 ”。 
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(4) 插 枝 INSERTLEFT(BT, x, Y) 及 INSERTRIGHT(BT., x, Y): 加 工 型 运算 ， 分 别 将 以 
结 点 Y 为 根 的 二 叉 树 置 为 二 叉 树 BT 中 结 点 x 的 左 子 树 和 右 子 树 。 若 原 树 BT 中 无 结 点 x 
或 结 点 X 已 有 相应 的 子 树 ， 则 空 操作 。 

(5) 前 枝 DELLEFT(BT, x) 及 DELRIGHT(BT, x): 加 工 型 运算 ， 分 别 删 除 二 又 树 BT 中 
结 点 x 的 左 子 树 和 右 子 树 。 知 x 无 左 子 树 或 右 子 树 ， 或 x 不 在 BT 中 ， 则 为 空 操作 。 

(6) 人 遍历 TRAVERSE(BT): 引用 型 运算 ， 按 某 种 次 序 访问 二 又 树 中 各 个 结 点 ， 使 每 个 
结 点 只 被 访问 一 次 。 

这 些 基本 运算 在 实际 应 用 中 也 可 根据 需要 适当 增 减 ， 如 增加 求 根 、 求 左右 兄弟 、 建 树 、 
但 找 和 删除 结 点 等 运算 。 


5.2.2 二叉树 的 性 质 


性 质 1 二 叉 树 第 i 层 上 的 结 点 数 最 多 为 2 (i 二 1)。 

证 ; 使 用 归纳 法 。 二 1 时 ， 结 论 显然 成 立 。 设 =k-1 时 结论 亦 成 立 ， 即 第 k-1 层 上 的 
结 点 数 最 多 为 2 “， 则 考虑 二 =k 时 的 情形 。 由 于 二 叉 树 每 个 结 点 最 多 有 两 个 孩子 ， 故 第 k 
层 上 的 结 点 数 最 多 是 第 k-1 层 上 结 点 数 的 2 倍 ， 即 最 多 2X2 =2* 1! 个 ， 故 命题 成 立 。 

性 质 2 深度 为 k 的 二 叉 树 至 多 有 2 一 1 个 结 点 〈k>=1)。 

证 : 在 深度 相同 的 二 叉 树 中 ， 仅 当 每 一 层 的 结 点 数 都 达到 最 多 时 ， 树 中 结 点 总 数 才 最 
多 ， 于 是 由 性 质 1 可 知 ， 深 度 为 k 的 二 又 树 的 结 点 数 最 多 为 2"+21+…+25 -2 二 1。 证 毕 。 

如 果 深 度 为 k 的 二 叉 树 有 2 一 1 个 结 点 , 则 称 此 二 又 树 为 满 二 叉 树 ”(Full Binary Tree )。 
它 的 特点 是 每 一 层 上 的 结 点 数 都 达到 了 最 大 ， 即 对 给 定 的 高 度 ， 它 是 具有 最 多 结 点 数 的 二 
叉 树 。 满 二 又 树 中 不 存在 度 为 1 的 结 点 ， 每 个 分 支 结 点 均 有 两 棵 高 度 相 同 的 子 树 ， 且 所 有 
叶子 都 在 最 下 一 层 上 ， 见 网 5.7 (a)。 

若 一 棵 二 叉 树 至 多 只 有 最 下 面 两 层 上 的 结 点 的 度 可 以 小 于 2， 并 且 最 下 层 上 的 结 点 都 
集中 在 该 层 最 左边 的 若干 位 置 上 ， 则 此 二 又 树 称 为 完全 二 义 树 ”(Complete Binary Tree)。 它 
相当 于 在 满 二 又 树 的 最 底层 ， 从 右 问 左 连续 去 掉 若 干 个 结 点 后 得 到 的 二 又 树 ， 见 图 5.7 (b)。 
显然 ， 在 完全 二 又 树 中 ， 若 一 个 结 点 没有 左 孩 子 ， 则 它 一 定 没有 右 孩 子 ， 即 必定 是 叶子 。 


HI1 JKLMNO H 1 JKEL 一 | J K H 1 J KL 
(a) 满 二 又 树 (b) 完全 二 叉 树 (c) 非 完 全 二 又 树 (d) 非 完 全 二 又 树 


图 5.7 完全 二 又 树 和 非 完全 二 又 树 示例 


GD 有 的 文献 称 此 为 完美 二 又 树 (Perfect Binary Tree)， 而 满 二 又 树 指 本 书 所 称 的 严格 二 叉 树 ; 也 有 的 
文献 称 此 为 Complete Binary Tree， 而 对 应 本 书 完全 二 又 树 的 是 Nearly Complete Binary。 

G@ 有 的 文献 称 此 为 顺序 二 叉 树 : 与 同 高 度 的 满 二 又 树 前 n 个 结 点 按 层次 顺序 一 一 对 应 ; 也 有 的 文献 
完全 二 又 树 指 本 书 所 称 的 严格 二 又 树 。 
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满 二 又 树 是 完全 二 又 树 ， 但 完全 二 又 树 不 一 定 是 满 二 又 树 。 空 二 叉 树 和 只 含 一 个 结 点 
的 二 又 树 既 是 满 二 叉 树 ， 也 是 完全 二 又 树 。 

性 质 3 二叉树 中 ， 度 为 0 的 结 点 数 no 和 度 为 2 的 结 点 数 nz 满足 no=nz+1。 

证 : 因为 二 叉 树 中 所 有 结 点 的 度 只 可 能 是 0、1 或 2， 所 以 结 点 总 数 n 应 等 于 0 度 结 点 
数 no、1 上 度 结 点 数 m 和 2 度 结 点 数 nz 之 和 : 

n~—notnitn> 

另 一 方面 ， 度 为 1 的 结 点 有 一 个 孩子 ， 度 为 2 的 结 点 有 两 个 孩子 ， 故 二 叉 树 中 孩子 结 
点 数 为 n+2n，2>， 但 根 不 是 任何 结 点 的 孩子 ， 故 二 又 树 中 的 结 点 总 数 又 可 表示 为 孩子 结 点 数 
与 根 之 和 : 

n=ni1+2n2+] 

结合 上 面 两 式 ， 即 可 导出 no=n2+1。 

性 质 4 具有 nn 个 结 点 的 完全 二 叉 树 的 深度 为 logn 上 +1 或 | log,+Dl) |。 

证 : 设 k 为 所 求 完全 二 叉 树 的 深度 。 由 完全 二 又 树 定 义 知道 ， 它 的 前 k-1 层 是 深度 为 
k-1 的 满 二 又 树 ， 结 点 数 为 2 1。 但 第 k 层 上 还 有 若干 个 结 点 ， 则 总 结 点 数 n>2* 一 1。 
另 由 性 质 2 知道 n 和 2 一 1， 所 以 : 

2 -1<n 和 2 一 ] 

由 该 式 得 2 '<nt+1<2， 取 对 数 后 有 k-1<log,(n+l)<k， 即 log,(n+1)<k<log,(n+1)+1， 
由 于 k 为 整数 ， 即 得 二 log,(n+1) |。 

另外 ,注意 到 n 为 整数 , 由 上 式 还 可 得 2"<n<2", 取 对 数 后 有 k-1<logn<k, 即 logn<k 
<logyn+1， 由 于 为 整数 ， 又 可 得 k 才 logynj+1。 证 毕 。 

对 二 又 树 的 所 有 结 点 ， 我 们 可 按 一 定 规则 对 其 编写， 其 中 很 卓然 的 方法 是 按 层 次 顺序 
进行 ， 即 层 序 编号 。 具 体 说 ， 就 是 从 根 结 点 开始 ， 从 上 层 到 下 层 ， 每 一 层 从 左 到 右 ， 依 次 
给 所 有 结 点 标记 1, 2,…,n， 其 中 根 的 编写 为 1，n 为 结 点 总 数 ， 见 图 5.8 所 示 。 


(a) 完全 二 又 树 (b) 非 完全 二 又 树 


图 5.8 二 义 树 的 层 序 编号 


性 质 5 在 完全 二 又 树 的 层 序 编号 中 ， 对 任 一 编号 为 i 的 结 点 x (1<i<n)， 有 : 

(1) 若 这 1， 则 x 的 双亲 编号 为 /2J; 若 二 1， 则 x 是 根 ， 无 双亲 。 

(2) 若 2i>n， 则 x 无 左 孩 子 ， 否 则 其 左 孩 子 的 编号 为 21。 完 全 二 又 树 中 的 结 点 若 无 左 
孩子 则 肯定 也 无 右 孩 子 ， 即 为 叶子 ， 故 编号 这 n/2 | 的 结 点 必定 是 叶子 。 

(3) 阁 2it1>n， 则 x 无 右 孩 子 ， 否 则 其 右 孩 子 的 编号 为 2i+1。 

(4) 若 i 为 奇数 且 不 为 1， 则 x 的 左 兄弟 编号 为 1; 否则 无 左 兄弟 。 

(5) 若 i 为 偶数 且 小 于 n， 则 x 的 右 兄弟 编号 为 +1; 否则 无 右 兄弟 。 


这 一 性 质 可 用 数学 归纳 法 证 明 (上 略 )。 

性 质 5 实际 上 指出 了 这 样 一 个 重要 事实 : 完全 二 叉 树 中 结 点 之 间 的 父子 关系 可 由 它们 
层 序 编号 间 的 关系 来 表达 ， 如 图 5.9 所 示 。 

注意 ， 该 性 质 是 对 完全 二 又 树 而 言 的 ， 对 
非 完 全 二 又 树 则 不 成 立 ， 如 图 5.8 (b) 中 ， 结 
点 DD 的 编号 为 4， 它 的 左 孩 子 G 的 编号 是 7 而 
不 是 2x4=8。 


如 果 结 点 编写 从 0 开始 ， 上 述 结 果 需 要 上 略 
作 修 改 ， 如 编号 为 1 (0<i<n-1) 的 结 点 ， 其 双 (a) i 为 偶数 (b) i 为 奇数 
亲 为 |(i-1)/2j、 左 孩子 为 2i+1 等 。 若 无 特别 声 
明 ， 本 书 中 结 点 编号 一 般 从 1 开始 。 图 5.9 完全 二 又 树 层 序 编号 与 父子 关系 


5.2.3 二 义 树 的 存储 


二 义 树 的 存储 结构 应 能 体现 二 又 树 的 逻辑 关系 ， 即 能 反映 结 点 的 双 杀 和 和 孩子 关系 。 二 
又 树 通 音 有 两 类 存储 结构 : 顺序 存储 结构 和 链 式 存储 结构 。 

1. 二 义 树 的 顺序 存储 

二 义 树 的 顺序 存储 就 是 将 所 有 结 点 存储 到 一 片 连续 的 存储 单元 中 ， 并 能 通过 结 点 间 的 
物理 位 置 关 系 反 映 罗 辑 关 系 。 这 实际 上 就 是 要 将 二 叉 树 的 所 有 续 点 按 一 定 次 序 排 成 一 个 线 
性 序列 ， 并 且 序 列 中 绪 点 间 的 次 序 关 系 要 能 反映 结 点 间 的 逻辑 关系 。 

由 性 质 5 知 ， 完 全 二 叉 树 结 点 的 层 序 编号 可 反映 绪 点 间 的 逻辑 关系 ， 即 由 结 点 编号 可 
推算 出 它 的 双亲 和 孩子 的 编号 。 所 以 ， 完 全 二 又 树 的 结 点 可 按 层 序 编号 的 次 序 存储 到 一 个 
回 量 bt[1..maxsize| 中 ， 男 外 再 指出 结 点 数 n。 由 于 C/C++ 语言 数组 的 下 标 从 0 开始 ， 编 号 
为 1 的 结 点 将 存放 在 下 标 为 二 1 的 单元 内 ， 即 结 点 编号 和 数组 下 标 总 要 进行 转换 ， 不 方便 。 
为 此 ， 我 们 将 数组 定义 为 btfmaxsize+1]， 并 从 数组 下 标 1 开始 使 用 。 这 就 是 完全 二 又 树 的 
顺序 存储 结构 ， 其 C/C++ 语言 描述 如 下 : 

const int maxsize=100; // 结 点 数 的 最 大 值 ， 假 设 为 100 

typedef struct 1{ 

datatype bt [maxsize+1];  //0 号 单元 未 用 

} a 

其 中 数组 bt 的 0 号 单元 不 用 , 但 可 用 来 存放 其 他 信息 ， 如 结 点 数 〈 这 时 数据 域 n 可 省 
略 )。 由 于 结 点 的 编号 就 是 数组 的 下 标 , 所 以 通过 下 标 间 的 数值 天 系 就 可 知道 结 点 之 间 的 父 
子 关系 ， 即 不 需 附 加 任何 信息 就 可 表示 逆 辑 关系 。 例 如 ， 图 5.10 是 图 5.8 (a) 完全 二 文 树 
的 顺序 存储 结构 示意 图 ， 其 中 bt[5] 的 双亲 是 bt[2]， 其 左 、 右 孩子 分 别 是 bt[10] 和 bt[11]; 
bt[9] 的 双亲 是 bt[4]， 它 没有 护 子 ， 因 为 二 9，n=12， 这 时 21>n。 

显然 ， 对 完全 二 又 树 而 言 ， 顺 序 存 储 结构 既 简 单 又 节省 存储 空间 。 

然而 ， 对 一 般 的 二 叉 树 ， 结 点 间 的 层 序 编号 关系 并 不 能 反映 逻辑 关 系 ， 所 以 不 能 直接 
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采用 上 述 方法 。 但 是 ， 如 果 在 二 又 树 上 补充 一 些 “ 虚 结 点 ”使 其 成 为 完全 二 叉 树 ， 则 可 使 
用 上 述 方 法 了 。 由 于 要 存储 “ 虚 结 点 ”， 会 有 一 定 的 空间 浪费 ， 在 最 坏 的 情况 下 ， 一 个 深度 
为 k 且 只 有 kk 个 结 点 的 右 单 支 树 却 需要 2 一 1 个 结 点 的 存储 空间 。 例 如 ， 只 有 3 个 结 点 A、 
B 和 C 的 右 单 文 树 ， 将 其 添上 一 些 实际 上 并 不 存在 的 “ 虚 结 点 ”后 , 使 它 成 为 如 图 5.11 (a) 
所 示 的 完全 二 又 树 ， 相 应 的 顺序 存储 结构 见 图 5.11 (b)。 图 中 虚线 和 “人 ”表示 虚 结 点 。 


1 234 5 6 7 maxsize 
123456789 101112 maxsize bt|A|^|B| AIA|^jcl…| | 
bt|AlBlclplElFlclhllJlkll | | 7 1 
+ 
n [es (b) 
图 5.10 图 5.8 (a) 完全 二 又 树 的 顺序 存储 图 5.11 非 完全 二 叉 树 的 顺序 存储 


2. 二 义 树 的 链 式 存储 

从 上 面 看 到 : 用 顺序 方式 存储 一 般 的 二 又 树 将 浪费 存储 空间 ; 另外， 这 种 存储 方式 下 
在 树 中 插入 和 删除 结 点 也 不 方便 。 因 此 ， 树 的 最 目 然 的 存储 方法 是 采用 链 式 存储 。 二 又 树 
链 式 存储 的 基本 思想 是 ， 每 个 结 点 除了 存放 本 和 喘 的 数据 外 ， 还 要 根据 需要 设置 指 癌 双亲 和 
左 、 右 孩子 的 指针 ， 即 通过 指针 来 反映 逻辑 关系 。 这 样 ， 根 据 指针 的 设置 情况 ， 存 储 方式 
可 分 为 一 指针 式 、 二 指针 式 和 三 指针 式 。 具 体 选用 何 种 方式 ， 主 要 考虑 运算 实现 的 方便 程 
度 以 及 运算 的 频 度 。 

与 普通 链 式 存 储 一 样 ， 二 又 树 的 链 式 存储 可 以 是 “静态 ”的 ， 也 可 以 是 “动态 ”的 。 
常用 的 是 动态 链 式 存储 , 这 时 一 般 不 用 担心 空间 溢出 问题 , 也 不 必 关 心 存 储 管理 的 细节 (由 
系统 完成 )， 这 使 我 们 能 用 更 多 的 精力 去 考虑 其 他 问题 。 在 本 章 内 我 们 以 动态 链表 为 主 ， 也 
在 适当 地 方 介绍 一 下 项 态 方法 。 

二 叉 链 表 是 二 又 树 最 常用 的 存储 结构 ， 其 中 每 个 结 点 除了 存储 结 点 本 喘 的 数据 外 ， 还 
设置 两 个 指针 域 child 和 rchild， 分 别 指 癌 该 结 点 的 左 孩 子 和 右 孩 子 。 这 是 二 叉 树 链 式 存储 
的 二 指针 形式 。 融 像 单 链表 由 头 指 针 唯 一 确定 一 样 ， 一 个 二 又 链表 也 由 指 癌 根 结 点 的 根 指 
针 唯 一 确定 。 为 了 某 些 运算 的 方便 ， 也 可 给 二 又 链表 增加 头 结 点 〈 但 一 般 并 没有 这 样 做 )。 
二 又 链表 的 结 点 结构 为 : 


二 又 链表 的 类 型 定义 如 下 : 
typedef struct node * pointer; 
struct node f{ 

datatype data; 

pointer lchild,rchild; 


}; 
typedef pointer bitree; 


与 单 链 表 类 似 ， 这 里 定义 了 两 个 相同 的 类 型 pointer 和 bitrree， 前 者 用 于 指 同 链表 中 的 
一 般 结 点 ， 后 者 用 于 指 问 链表 的 根 结 点 ， 即 代表 二 又 链表 。 


图 $.12 (b) 就 是 图 5.12 (a) 所 示 二 又 树 的 二 叉 链表 。 吉 二 又 树 为 宅 ， 则 root=NULL。 
奇 结 点 的 菜 个 孩子 不 存在 ， 则 相应 的 指针 为 空 。 
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(a) 二 又 树 (b) 二 又 链表 (c) 带 双亲 指针 的 二 又 链 表 
图 5.12 二 又 链表 


下 和 面 几 节 给 出 的 有 关 二 又 树 的 各 种 算法 ， 大 多 数 是 基于 这 种 存储 结构 的 。 如 果 经 常 要 
在 二 又 树 中 寻找 某 结 点 的 双亲 (或 者 祖先 等 )， 则 可 采用 三 指针 形式 : 在 每 个 结 点 上 再 增加 
一 个 指向 其 双亲 的 指针 域 parent， 形 成 一 个 带 双 亲 指 针 的 二 又 链表 ”。 图 5.12 (c) 就 是 图 
5.12 (a) 所 示 二 又 树 的 市 双 杀 指针 的 二 又 链表 。 至 于 一 指针 形式 ， 就 是 在 每 个 结 点 中 只 存 
放 一 个 指向 双亲 的 指针 ， 这 就 是 后 面 将 要 介绍 的 树 的 双亲 表示 法 。 


63 二 又 树 的 遍历 


在 二 叉 树 的 一 些 运 算 中 ， 经 党 要 但 找 菏 种 特征 的 结 点 ， 或 对 所 有 结 点 逐一 进行 菏 种 处 
理 ， 这 就 涉及 二 又 树 的 表 历 问题 ， 它 是 二 又 树 的 一 种 重要 运算 。 二 又 树 的 遍历 (Traversal) 
是 指 沿 茶 条 搜索 路 径 周 洲 二 叉 树 ， 对 每 个 结 点 访问 一 次 且 仅 访问 一 次 。 这 里 的 访问 是 指 对 
结 点 进行 茶 种 处 理 ， 处 理 的 内 容 依 具 体 问 题 而 定 ， 可 以 是 谈 、 与 、 修 改 等 。 

我 们 知道 ， 过 历 一 个 线性 结构 很 容易 ， 只 需 从 开始 结 点 出 发 顺序 扫描 每 个 结 点 即 可 。 
但 二 又 树 是 一 个 非 线 性 结构 ， 每 个 结 点 可 以 有 两 个 后 继 ， 因 此 ， 需 要 寻找 某 种 规律 来 系统 
地 访问 树 的 各 个 结 点 。 


5.3.1 二 又 树 的 过 历 方法 
1. 递归 遍历 
根据 定义 ,一 棵 非 空 的 二 叉 树 是 由 根 结 点 、 左 子 树 、 右 子 树 这 三 个 部 分 组 成 的 ， 因 此， 


遍历 一 棵 非 空 二 又 树 的 问题 可 分 解 为 3 个子 问题 : 访问 根 结 点 ; 人 遍历 左 子 树 ; 人 遍历 右 子 树 。 
车 分 别 用 D、L 和 R 表示 上 述 3 个 子 问 题 ， 则 有 DLR、LDR、LRD、DRL、RDL、RLD 


(D 有 的 文献 称 之 为 “三 义 链表 ”。 
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等 6 种 次 序 的 过 有 历 方 案 。 其 中 前 3 种 方案 是 按 先 左 后 右 的 次 序 过 历 根 的 两 柠 子 树 ， 后 3 种 
方案 则 是 按 先 右 后 左 的 次 序 遇 历 根 的 两 柠 子 树 ， 由 于 二 者 对 称 ， 故 我 们 只 讨论 前 3 种 次 施 
的 遍历 方案 。 

对 遍历 方案 DLR, 访问 根 的 操作 是 在 遍历 其 左 、 右 子 树 之 前 进行 的 ， 故 称 之 为 前 序 遍 
历 (或 先 根 遍 历 )。 类似 地 , LDR 和 LRD 分 别称 为 中 序 遍 历 (或 中 根 遍 历 ) 和 后 序 遍 历 (或 
后 根 遍 历 )。 由 于 左 、 右 子 树 本 喘 也 是 二 又 树 ， 对 它们 的 遍历 也 要 按 同样 的 规则 进行 处 理 ， 
于 是 ， 二 又 树 的 遍历 就 成 为 一 个 递归 问题 ， 因 而 很 容易 写 出 3 种 遍历 方法 的 递归 定义 。 

(1) 前 序 壳 历 

吉 二叉树 非 空 ， 则 依次 进行 如 下 操作 : 

Q 访问 根 结 点 。 

@) 前 序 壳 历 左 子 树 。 

@) 前 序 遍 历 右 子 树 。 

(2) 中 序 所 历 

右 二 叉 树 非 空 ， 则 依次 进行 下 列 操作 : 

Q 中 序 遍 历 左 子 树 。 

@ 访问 根 结 点 。 

@) 中 序 壳 历 右 子 树 。 

(3) 后 序 壳 历 

右 二 叉 树 非 实 ， 则 依次 进行 以 下 操作 : 

Q 后 序 壳 历 左 子 树 。 

@) 后 序 遍 历 右 子 树 。 

@) 访问 根 结 点 。 

按 以 上 3 种 方法 壳 历 ， 都 可 得 到 所 有 结 点 的 一 个 访问 序列 ， 分 别称 为 先 根 〈 壳 历 ) 序 
列 、 中 根 (遍历 ) 序列 和 后 根 〈 遍 历 ) 序列 。 例 如 ， 对 图 5.12 (a) 所 示 的 二 又 树 进行 遍历 ， 
得 到 的 先 根 序 列 为 {A, B,D, 下 EE,G,C}; 中 根 序列 为 {人 D, 下 B, GE,A,C}; 后 根 序列 为 {Ff, D， 
G, E, B, C, A}. 

由 于 上 述 壳 历 是 递归 定义 的 ， 故 很 容易 写 出 相应 的 递归 算法 。 显 然 递 归 终 止 条 件 是 二 
又 树 为 空 ， 此 时 应 为 空 操 作 。 假 设 对 根 结 点 的 访问 是 打印 结 点 数据 ， 则 在 二 又 链表 上 实现 
的 3 个 过 历 算 法 如 下 : 


void preorder (bitree t) { // 先 根 遍 历 
1 {t==NULL) TOtUrNns 


cout<<t->data<<endl:; // 访 问 根 
preorder (t->lchild); // 先 根 遍 历 左 子 树 
preorder (t->rchild); // 先 根 志 历 右 子 树 


} 
void inorder (bitree 七 ) { // 中 根 遍 历 
1 工人 ENOLD returens 


inorder (t->lchild); // 中 根 遍 历 左 子 树 
cout<<t->data<<endl; // 访 问 根 
inorder (t->rchild); // 中 根 遍 历 右 子 树 


} 
void postorder (bitree t) { // 后 根 遍 历 


Tf (t==NUELD)Y Teturns 
postorder (t->lchild); // 后 根 遍 历 左 子 树 
postorder (t->rchild); // 后 根 遍 历 右 子 树 
Cout<<t->data<<endl:; // 访 问 根 

} 


为 了 便于 理解 上 述 3 种 递归 算法 ， 以 先 根 遍 历 为 例 ， 对 图 5.13 (a) 所 示 的 二 又 树 ， 其 
先 根 遍 历 执行 过 程 如 图 5.13(b) 所 示 , 将 其 全 部 的 递归 调用 关系 画 出 来 , 得 到 图 5.13〈c )。 
其 中 为 简洁 起 见 ， 将 函数 名 preorder 简写 为 pre, 将 1child 和 rchild 分 别 简 写 为 1 和 r。 虚 线 
上 的 第 头 表 示 各 个 递归 调用 的 次 序 。 可 见 ， 所 有 的 调用 过 程 〈( 虚 线 ) 组 成 了 忆 历 的 搜索 路 
线 。 递 归 调 用 关系 完全 可 以 男 在 原 树 上 ， 得 到 更 加 简洁 直观 的 图 5.14， 其 中 “ 八 ” 表 示 虚 
结 点 。 可 以 发 现 ， 搜 索 路 线 的 特点 是 ， 从 根 结 点 出 发 ， 逆 时 针 沿 看 二 叉 树 外 缘 和 移动， 每 个 
结 点 均 经 过 了 3 次 。 


访问 根 结 点 D 
@) 访 问 D 的 左 子 树 (为 空 ) 
访问 根 结 点 B @ 访 问 D 的 右 子 树 (为 空 ) 


A 
@ 访 问 根 结 点 A 芒 问 B 一 一 > 访问 根 结 点 E 
So 加 访问 A 的 左 子 树 全 一/ @@ 访 问 E 的 左 子 树 (为 空 ) 
@ 访 问 A 的 右 子 树 ~、、、 @@ 访 问 E 的 右 子 树 (为 空 ) 


D E Q@ 访 问 根 结 点 C 
@ 访 问 C 的 左 子 树 (为 空 》 
@ 访 问 C 的 右 子 树 (为 空 》 


(a) 二 又 树 (b) 先 根 遍 历 的 执行 过 程 


一 


ee 
pre(t-> 广 >|) 


了 
Teme" 


(c) 先 根 遍 历 的 递归 调用 关系 


- 一 
下 


5.13 ”二 义 树 先 根 遍 历 的 递归 调用 关系 


5.14 遍历 二 又 树 的 搜索 路 线 
也 可 男 出 中 根 遇 历 和 后 根 遇 历 的 调用 关系 图 ,结果 发 现 3 种 志 历 的 搜索 路 线 是 相同 的 。 


NA 
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这 很 好 理解 ， 因为 , 假设 去 反对 根 的 访问 《或 用 空 语句 代替 )， 3 种 忆 历 算法 就 是 一 样 的 了 ， 
从 而 具有 相同 的 搜索 路 线 。 

它们 的 区 别 在 于 访问 结 点 的 “时 机 ”不 同 : 奋 访 问 结 点 均 是 在 第 一 次 经 过 时 进行 ， 则 
是 前 序 遇 历 ， 奉 访问 结 点 均 是 在 第 二 次 《或 第 三 次 ) 经 过 时 进行 ， 则 是 中 序 志 历 ( 或 后 序 
过 历 )。 因 此 ， 只 要 将 搜索 路 线 上 所 有 在 第 一 次 、 第 二 次 和 第 三 次 经 过 的 结 点 分 别 列表 ， 即 
可 分 别 得 到 该 二 又 树 的 前 序 序列 、 中 序 序列 和 后 序 序列 。 

人 表 历 算法 的 基本 操作 是 访问 结 点 ， 显 然 ， 不 论 授 哪 种 次 序 所 历 ， 对 含 1 个 结 点 的 二 叉 
树 , 其 时 间 复 杂 上 度 均 为 O(n)。 所 需 辅 助 空间 为 递归 亿 历 过 程 中 栈 的 最 大 容量 , 即 树 的 深度 ， 
最 坏 情 况 下 为 n， 则 空间 复杂 上 度 也 为 O(n)。 


中 序 序 列 具 有 下 列 特点 《以 后 有 关 和 章节 中 会 用 到 ): 

QD 中 序 序列 的 第 一 个 结 点 是 二 又 树 中 最 左下 的 结 点 。 

色 中 施 序 列 的 最 后 一 个 结 点 是 二 叉 树 中 最 右 下 的 结 点 。 

所 谓 最 左下 的 结 点 ， 是 指 从 根 开 始 ， 沿 左 指针 链 往 下 碍 找 ， 直 到 找到 一 个 左 指针 为 空 
(没有 左 孩 子 ) 的 结 点 为 止 ， 这 个 结 点 就 是 “最 左下 ”的 结 点 。 注 总， 最 左下 的 结 点 虽然 没 
有 左 孩 子 ， 但 可 能 有 右 孩 子 〈 也 可 能 无 右 孩 子 )。 大 无 右 孩 子 ， 则 它 必 定 是 叶子 。 类 似 地 ， 
最 右 下 的 结 点 束 是 从 根 开始 , 沿 右 指针 链 往 下 得 找 , 下 到 找到 一 个 没有 右 孩 子 的 结 点 为 止 ， 
该 结 点 是 “最 右 下 ”的 结 点 。 


例 S.1 写 出 图 5.15 所 示 二 叉 树 的 先 根 、 中 根 和 后 根 过 历 序列 。 

解 : 先 根 志 历 序列 为 : +-a/b+cd*ef。 

中 根 遍 历 序列 为 : a-b/c+d+e#kf。 

后 根 壳 历 序 列 为 : abcd+/-ef*+。 

实际 上 这 种 类 型 的 二 又 树 称 为 表达 式 树 ， 它 的 叶子 结 点 表 
示 操 作 数 ， 分 文 结 点 表示 操作 符 。 如 果 一 个 表达 式 中 的 操作 符 
都 是 双 目 或 单 目 的 , 则 一 个 表达 式 可 对 应 到 一 棵 二 又 树 。 图 5.15 
表示 的 实际 上 就 是 表达 式 a-b/(ctd)t+e*f。 其 先 根 、 中 根 和 后 根 
过 历 序列 分 别称 为 表达 式 的 前 组 表示 (prefix， 小 兰 式 )、 中 缀 
表示 (infix) 和 后 组 表示 (postfix， 逆 波兰 式 ): 各 操作 符 分 别 
在 对 应 操作 数 之 前 、 之 中 和 之 后 《但 操作 数 的 顺序 相同 )。 图 5.15 表达 式 树 

中 组 表示 与 原 表 达 式 一 致 ， 但 无 括号 ， 这 可 对 中 根 壳 历 略 作 修 改 : 在 遍历 左 子 树 前 打 
印 左 括号 ， 在 志 历 右 子 树 后 打印 右 插 号 ， 结 果 即 得 原 表达 式 : (a-(b/(c+d))+(e*f))。 后 级 表 
示 和 前 绥 表 示 没 有 歧义 ， 不 必 采 用 括号 或 优先 级 。 

这 里 顺便 说 说 表达 式 的 求 值 。 后 级 表达 式 和 前 级 表达 式 的 求 值 较 简 单 : 借助 操作 数 栈 ， 
从 左 问 右 或 从 右 回 左 扫描 表达 式 ， 奋 遇 到 操作 数 ， 承 入 栈 ; 硅 过 到 操作 符 ， 则 操作 数 出 栈 ， 
由 操作 符 运 算 后 把 结果 作为 操作 数 再 入 栈 ……。 而 中 级 表 达 式 的 求 值 较 麻 烦 ， 需 要 操作 数 
和 操作 符 两 个 栈 , 还 要 考虑 各 操作 符 的 优先 级 (对 扫描 到 的 操作 符 分 情况 处 理 )。 也 可 先 转 
化 为 后 缀 表示 或 前 绥 表 示 后 册 求 值 ， 这 要 借助 操作 人 符 栈 ， 也 要 考虑 各 操作 符 的 优先 级 。 只 
体 就 不 细 述 了 。 

2. 层 序 遍历 

由 于 树 形 结构 的 结 点 间 形 成 分 文 和 层次 关系 ， 所 以 如 果 逐 层 地 对 结 点 进行 访问 ， 也 可 


表达 式 a-b/(c+d)+e”f 的 二 又 树 


将 所 有 结 点 都 访问 到 ， 这 就 是 层 序 志 历 。 所 谓 二 又 树 的 层 序 遍历 ， 是 指 从 第 一 层 〈 即 根 》 
开始 ， 按 从 上 属 到 下 层 ， 每 层 内 按 从 左 到 右 的 顺序 对 结 点 逐个 访问 。 如 对 图 5.12(a) 所 示 的 
二 叉 树 ， 其 层 序 遍历 序列 为 A, B, C, D, E, FE G。 实 际 上 ， 前 面 对 二 叉 树 结 点 进行 层 序 编号 
的 过 程 就 是 一 种 层 序 志 历 ， 只 是 访问 结 点 时 的 操作 是 给 它 一 个 编号 而 已 。 

由 于 上 下 层 结 点 之 间 上 共有 父子 关系 ， 在 层 序 志 历 中 必然 是 先 访 问 的 结 点 其 孩子 结 点 也 
先 访问 ， 即 大 结 点 A 先 于 结 点 B 访问 ， 则 结 点 A 的 孩子 也 先 于 结 点 B 的 孩子 访问 。 这样， 
在 层 序 饥 历 中 ,我 们 可 用 一 个 队列 来 保存 竺 访问 的 结 点 (已 访问 结 点 的 孩子 )。 人 过 历 算法 为 : 
每 访问 一 个 结 点 ， 束 将 它 的 孩子 指针 入 队 ， 下 一 个 要 访问 的 结 点 是 队 头 (出 队 ); 这 个 过 程 
不 断 进 行 ， 直 到 队列 为 空 。 


除了 第 一 个 结 点 〈 即 根 ) 外 ， 其 他 结 点 都 是 从 队列 中 取出 并 进行 处 理 的 。 为 使 根 和 其 
他 结 点 的 处 理 一 致 ， 可 采用 预 入 队 技 术 ， 即 在 算法 开始 时 先 将 根 结 点 入 队 ， 然 后 马上 出 队 
再 进行 有 关 处 理 。 非 形式 算法 如 下 : 
入 队 ( 根 指针 )，; 
while ( 队 不 空 ) { 
出 队 (指针 p); 
访问 p; 
入 队 ( 左 孩 子 )，; 
入 队 ( 右 孩子 ) ; 
} 
假设 对 结 点 的 访问 是 打印 结 点 数据 ， 并 注意 到 空 指针 不 必 入 队 ， 则 具体 算法 如 下 : 


void levelorder (bitree 七 ) { // 层 序 遍 历 
pointer p; 
sqqueue 0Q; // 循 环 队 列 ， 队 列 元 素 为 结 点 指针 ， 类 型 为 pointer 
1f (t==NULD) Teturns 
init sqqueue (&Q) ; 


en_sqqueue (&Q,t); // 根 结 点 入 队 
while(!empty_sqqueue (&Q)) { // 队 列 非 空 时 
de sqqueue(&Q, &p) ;cout<<p->data<<endl; // 出 队 ， 访问 队 头 


if (p->lchild!=NULL) en sqqueue (&Q,p->lchild);  // 左 孩子 入 队 
if (p->rchild!=NULL) en sqqueue (&Q,p->rchild);  // 右 孩子 入 队 
} 
} 


对 该 算法 进行 修改 ， 还 可 输出 各 结 点 的 层 数 、 树 的 高 度 、 宽 度 等 。 

上 面 介绍 的 几 种 遍历 序列 都 是 线性 序列 ， 有 且 仅 有 一 个 开始 结 点 和 一 个 终端 结 点 ,其 余 
结 点 都 有 且 仅 有 一 个 前 趋 和 一 个 后 继 。 为 了 区 别 树 形 结构 中 前 趋 ( 即 双亲 ) 和 后 继 ( 即 孩子 
的 概念 ， 对 上 述 各 种 线性 序列 ， 我 们 在 结 点 的 前 趋 和 后 继 之 前 冠 以 相应 遍历 次 序 的 名 称 。 例 
如 ， 图 5.12 (a) 所 示 二 叉 树 中 ， 结 点 B 的 层 序 前 趋 是 A， 层 序 后 继 是 C; 中 序 前 趋 是 F， 
中 序 后 继 是 G 等 。 但 就 该 树 的 逻辑 结构 而 言 ， 结 点 B 的 前 趋 是 A， 后 继 是 D 和 E。 

上 述 各 种 遍历 都 是 基于 二 又 链表 的 ， 但 显然 也 可 在 顺序 存储 结构 上 实现 。 这 时 ， 层 序 
遍历 由 存储 结构 直接 得 到 (去 掉 虚 结 点 ), 递归 遍历 则 注意 利用 顺序 存储 规律 即 可 ， 如 某 材 


为 空 即 该 树 根 结 点 对 应 的 单元 为 虚 结 点 ` 结 点 1 的 左右 孩子 对 应 编号 为 2 和 2i+1 的 单元 等 ， 
具体 算法 就 不 细 述 了 。 


回顾 一 下 链表 ， 为 了 对 所 有 结 点 进行 某 种 处 理 ， 如 累计 结 点 数 〈 求 表 长 )， 需 要 从 头 
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开始 治 春 指针 链 逐 个 结 点 进行 ， 这 实际 上 就 是 链表 的 遇 历 。 一 般 而 言 ， 所 谓 遇 有 历 丈 是 对 所 
有 数据 结 点 按照 条 种 方式 无 重复 无 遂 漏 地 访问 ， 即 访问 且 只 访问 一 次 。 数 据 结构 中 的 很 多 
算法 ， 都 是 基于 过 历 的 ， 大 家 在 学 习 时 要 注意 体会 和 掌握。 

对 非 线 性 结构 树 以 及 下 一 章 将 要 介绍 的 图 ， 亿 历 后 可 得 到 所 有 结 点 按 茶 种 次 序 排列 的 
一 个 线性 序列 ， 所 以 遇 历 也 可 看 成 是 从 非 线性 结构 到 线性 结构 的 一 种 映射 方法 。 


5.3.2 ”二 义 树 壳 历 与 了 违 归 举例 


二 叉 树 的 定义 是 递归 的 ， 所 以 二 叉 树 的 很 多 问题 都 可 以 很 目 然 地 进行 递归 处 理 ， 其 中 
就 包括 裔 历 。 本 来 ,， 表 历 只 是 这 些 递 归 处 理 中 的 一 种 , 但 如 果 我 们 广义 地 看 竺 对 根 的 访问 ， 
即 相 应 的 处 理 可 以 是 任何 操作 ， 如 输出 其 内 容 、 某 种 性 质 的 判断 、 某 种 信息 的 处 理 等 ， 则 
很 多 问题 都 可 以 归结 到 遍历 上 。 这 样 对 同一 个 问题 ， 我 们 可 以 直接 用 递归 来 处 理 ， 也 可 以 
用 某 种 特殊 的 遍历 来 处 理 。 一 般 来 说 ， 如 果 问 题 具 有 比较 明显 的 逐个 结 点 处 理 的 特点 ， 则 
用 亿 历 比较 直观 ， 盏 则 就 按 根 、 左 子 树 、 右 子 树 三 部 分 递归 处 理 比较 简便。 
递归 程序 一 般 包括 递归 出 口 和 递归 体 两 部 分 。 在 二 叉 树 中 ， 递 归 出 口 一 般 是 二 又 树 为 
空 或 叶子 ， 此 时 不 能 册 递 归 ， 只 能 回 退 ; 递归 体 一 般 是 对 根 和 左 子 树 、 右 子 树 的 茶 种 处 理 。 
例 S.2 求 二 又 树 的 叶子 结 点 数 。 
解 : 这 个 问题 具有 明显 的 逐个 结 点 处 理 的 特点 : 如 果 当 前 结 点 是 叶子 ， 则 叶子 数 加 1。 
所 以 可 用 各 种 所 历法 ， 以 先 根 遍 历 为 例 ， 算 法 如 下 : 
int num=0; //num 为 叶子 数 ， 设 为 全 局 量 ， 并 初始 化 为 0 
Vold leaf (bitree 七 ) 1{ 
if (t==NULL) return;  // 空 树 什么 都 不 做 
if (t->lchild==NULL && 七 ->rchi1d==NULL) num++;// 访 问 根 : 若 为 叶子 ， 则 叶子 数 +1 
leaf (t->lchild); // 访 问 左 子 树 : 累计 其 中 的 叶子 数 
leaf (t->rchild); // 访 问 右 子 树 : 累计 其 中 的 叶子 数 
} 
上 面 将 叶子 数 设 成 全 局 量 而 不 作为 参数 , 是 考虑 到 递归 函数 执行 时 , 参数 要 频繁 传递 ， 
如 果 减 少 参 数 的 个 数 ， 可 提高 递归 函数 的 执行 效率 。 
求 叶 子 数 问题 ， 也 可 直接 从 递归 的 角度 来 考虑 : 二 叉 树 的 叶子 数 等 于 左 子 树 和 右 子 树 
的 叶子 数 之 和 ， 但 左 子 树 和 右 子 树 本 身 又 是 二 又 树 ， 求 其 叶子 数 要 递归 进行 。 算 法 如 下 : 
int leaf2 (bitree t) {  / /叶子 数 通过 图 数值 返回 
nt TT Rs 
if (t==NULL) return 0;// 空 树 的 叶子 为 0 
if(t->lchild==NULL && tt->rchild==NULL) return 1; // 树 中 只 有 一 个 点 , 就 是 叶子 
i—1eaf (t->1lchildys // 求 左 子 树 的 叶子 数 (访问 左 子 树 ) 
R=leaf (t->rchild); // 求 右 子 树 的 叶子 数 (访问 右 子 树 ) 
return L+R; // 叶 子 数 = 左右 子 树 叶子 数 之 和 (访问 根 ) 
} 
注意 ， 该 算法 需要 两 个 递归 出 口 ， 空 和 叶子 。 另 外 ， 即 使 是 这 个 算法 ， 也 可 看 成 一 种 
(后 根 ) 遍历 ， 先 访问 子 树 〈 求 子 树叶 子 数 )， 再 访问 根 〈 将 左 、 右 子 树 的 叶子 数 加 起 来 作 
为 当前 子 树 的 叶子 数 )， 但 这 显然 不 如 直接 按 递 归 考 虑 容易 理解 。 
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按 关 似 思想 ， 可 求 二 又 树 的 高 度 、 度 1 结 点 数 、 上 度 2 结 点 数 等 。 比 如 二 又 树 的 高 度 是 
左 、 右 子 树 中 高 度 较 大 者 加 1， 但 左 、 右 子 树 本 喘 又 是 二 叉 树 ， 故 递归 。 有 具体 算法 略 。 

例 $.3 交换 二 又 树 各 结 点 的 左右 子 树 。 

解 : 这 个 问题 显然 可 按 遇 历 思想 处 理 。 以 先 根 遇 历 为 例 ， 算 法 如 下 : 


void exchange (bitree t) { // 先 根 遍 历 型 
pointer p; 


if (t==NULL) return; // 空 树 
p=t—>lchild;t->lchild=t->rchild;t->rchild=p; // 交 换 
exchange (t->rchild); // 遍 历 原 左 子 树 ( 现 为 七 ->rchild) 
exchange (t->lchild); // 遍 历 原 右 子 树 ( 现 为 t->lchild) 


} 

注意 交换 后 左右 顺序 与 原来 相反 ， 如 访问 原 右 子 树 时 参数 为 扩 >lchild。 类 似 ， 大 采用 
中 根 遍 历 ， 则 在 访问 右 子 树 时 参数 也 应 为 t->lchild (这 时 遍历 左 、 右 子 树 时 的 参数 名 称 上 
都 为 t->lchild, 但 含义 不 同 , 一 个 是 交换 前 的 ,一 个 是 交换 后 的 )， 否 则 最 终 只 交换 了 根 结 
点 的 左右 孩子 。 显 然 ， 采 用 后 根 刀 历 则 不 存在 这 些 问题 。 


例 $S.4 已 知 二 又 树 各 结 点 存放 的 是 字符 ， 判 断 是 否 所 有 结 点 存放 的 都 是 数字 字符 。 
解 : 这 个 问题 显然 可 按 逐 结 点 过 历 处 理 ， 但 这 里 不 一 定 要 明 历 完 所 有 结 点 : 一 旦 发 现 


革 个 结 点 或 子 树 不 合 要 求 ， 就 不 必 对 后 继 子 树 进 行 和 遍 历 了 。 算 法 如 下 : 

int detect (bitree 七 ) { 
工科 在 区 9 
if (t==NULL) return 1; // 空 树 
if(t->data<’0’|| t->dqata>79")return 0;// 访 问 根 : 者 非 数 字 字 符 ， 则 跳 过 子 树 检查 
x=detct (t->lchild); if(x==0) return 0;// 遍 历 左 子 树 ， 若 为 假 ， 则 跳 过 右 子 树 检 查 
x=detct (t->rchild); // 遍 历 右 子 树 
return x; // 最 后 结果 由 右 子 树 决定 

} 


注意 ， 该 算法 将 空 树 看 做 真 ， 否 则 还 需 增 加 一 个 递归 到 叶子 〈 并 判断 真 假 ) 的 递归 
出 口 。 

本 例 也 可 直接 用 递归 的 思想 处 理 : 如 果 根 不 是 数字 字符 ， 则 当前 结果 肯定 为 假 ， 返 回 ; 
否则 当前 结果 由 左 子 树 和 右 子 树 的 情况 共同 决定 。 算 法 如 下 : 

int detect?2 (bitree 七 ) { 

于 (EL 二 ea 1 // 认 为 空 树 符 合 条 件 ( 真 ) 

if (t->data<’0’ ||t->data>’9’) return 0; // 访 问 根 : 者 不 是 数字 字符 则 返回 假 

return detct(t->lchild) && detct(t->rchild); // 左 子 树 和 右 子 树 共 同 决定 

} 

由 逻辑 与 运算 的 短路 规则 ， 该 算法 的 返回 语句 当 检 测 到 左 子 树 为 假 时 ， 并 不 会 再 检测 
右 子 树 而 直接 返回 假 〈 实 际 执行 过 程 与 上 一 算法 相同 ) 。 

例 S.$S 判断 两 棵 二 叉 树 是 否 等 价 ， 即 要 么 都 为 空 ， 要 么 根 相 同 ， 且 左右 子 树 分 别 
等 价 。 

解 : 这 个 问题 比较 适合 直接 按 递 归 思 想 处 理 ， 算 法 如 下 : 

int same (bitree tl ,blitree 七 2) { 


if (tl==NULL && t2==NULL) return 1;  // 同 时 为 空 
if (t1==NULL || t2==NULL) return 0;  // 一 个 为 空 ， 另 一 个 非 空 
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if (tl->data!=t2->data) return 0; // 根 不 相等 
return same (tl1->lchild,t2->lchild) && same (tl1->rchild,t2->rchild); 
// 左 子 树 和 右 子 树 共 同 决定 


} 

注意 , 算法 在 检 和 但 两 个 根 中 一 个 空 , 男 一 个 非 空 的 条 件 不 是 (tl 一 NULL && t2!=NULL) 
| (1!=NULL && {2 一 NULL)， 而 是 贡 一 NULL || t2 一 NULL， 这 是 因为 经 过 前 一 步 两 者 同 
时 为 空 的 检查 后 ，tl 和 了 t 蕊 已 不 可 能 同时 为 宝 了 ， 所 以 若 某 一 个 为 空 ， 则 另 一 个 必 不 为 空 。 

另外 ,算法 也 利用 了 5 逻辑 与 运算 的 短路 规则 ， 如 果 左 子 树 不 等 价 ， 并 不 会 检查 右 子 树 。 

顺便 指出 ， 例 5.4 和 例 5.5 对 根 和 左 、 右 子 树 的 检查 过 程 也 可 总 体 上 写成 一 句 的 形式 : 
returmn 根 && 左 && 右 ， 但 多 个 条 件 连 在 一 起 后 反而 显得 不 够 简洁 。 


64 二 又 树 的 生成 


二 叉 树 的 生成 是 指 如 何在 内 存 中 建立 二 又 树 的 存储 结构 。 建 立 顺序 存储 结构 较 简 单 ， 


这 里 仅 讨 论 如 何 建立 二 又 链表 。 要 建立 二 又 链表 ， 需 要 按 茶 种 方式 输入 二 又 树 的 结 点 及 其 
逻辑 信息 。 注 总 到 二 又 树 志 历时 ， 不 仪 得 到 了 结 点 信息 ， 而 且 由 序列 中 结 点 的 先后 关系 还 


可 获得 一 定 的 逻辑 信息 ， 如 果 这 些 信 息 足 够 ， 就 可 根据 遍历 序列 生成 相应 的 二 又 树 。 

本 节 二 又 树 的 生成 方法 就 是 基于 遍历 序列 的 ， 相 当 于 遍历 问题 的 逆 问 题 ， 即 由 遍历 序 
列 反 求 二 又 树 ， 这 需要 分 析 和 利用 二 又 树 遍历 序列 的 特点 。 以 下 分 3 种 情况 来 讨论 。 

1. 层 序 遍历 序列 

按 完 全 二 叉 树 的 层次 顺序 ， 依 次 输入 结 点 信息 来 建立 二 叉 链表 。 这 是 因为 完全 二 又 树 
的 层 序 过 历 序 列 中 ， 结 点 间 的 序号 关系 可 反映 父子 关系 即 风 辑 关 系 。 对 一 般 的 二 又 树 ， 要 
补充 在 干 个 虚 结 点 使 其 成 为 完全 二 叉 树 后 ， 再 按 其 层次 顺序 输入 。 例 如 ， 仅 含 3 个 结 点 A、 
B、C 的 右 单 文 树 《〈 见 图 5.11)， 按 完全 二 又 树 的 形式 输入 的 结 点 序列 为 : A@B@@@C#， 
其 中 @ 表 示 虚 结 点 ，# 表 示 输 入 结束 。 

算法 的 基本 思想 是 : 依次 输入 结 点 信息 ， 帮 输入 的 结 点 不 是 虚 结 点 ， 则 建立 一 个 新 结 
点 ; 在 新 结 点 是 第 1 个 结 点 ， 则 令 其 为 根 结 点 ， 否则 将 新 结 点 作为 孩子 链接 到 它 的 双亲 结 
点 上 。 如 此 重复 下 去 ， 直 至 输入 字符 “#” 为 止 。 

这 里 的 关键 是 新 结 点 与 其 双 杀 的 链接 。 由 于 结 点 是 按 层 次 目 左 癌 右 输入 的 ， 所 以 先 输 
入 的 结 点 ， 其 孩子 也 必定 较 先 输入 。 即 结 点 与 其 孩子 共有 先进 先 出 的 特点 ， 于 是 可 设置 一 
个 队列 ， 保 存 已 输入 结 点 的 地 址 。 这 样 ， 队 尾 是 当前 正 输入 的 结 点 ， 队 头 是 其 双亲 结 点 。 
当 队 头 结 点 的 两 个 孩子 都 输入 完毕 后 ， 出 队 ， 新 的 队 头 是 下 一 个 要 输入 孩子 的 双亲 结 点 。 
如 此 下 去 ， 直 到 输入 结束 符 为 止 。 

双亲 与 孩子 的 链接 方法 是 : 奎 当 前 输入 的 结 点 编号 是 偶数 ， 则 该 结 点 作为 左 孩 子 与 其 
双亲 链接 ; 否则 作为 右 孩 子 与 其 双亲 链 。 若 双亲 结 点 或 孩子 结 点 为 虚 结 点 ， 则 无 需 链接 。 

如 果 采 用 顺序 队列 ， 则 队列 是 一 个 指针 数组 。 为 使 队列 元 素 在 数组 中 的 下 标 与 其 结 点 
的 层 序 编号 一 致 ， 数 组 从 下 标 1 开始 使 用 。 注 意 ， 这 里 不 是 循环 队列 。 具 体 算法 如 下 : 

bitree level creat() { // 按 层 序 序列 建立 二 又 树 ， 返 回 根 指针 


Char ch; 


第 5 章 树 形 结构 Wp 


pointer Q[maxsize+l1]; // 非 循环 队列 ， 有 效 下 标 从 1 到 n，maxsize 为 最 大 结 点 数 
int front, rear; 
pointer root,s; 


root=NULL; // 置 空 二 又 树 

front=rear=0; // 置 空 队列 

while(cin>>ch,ch!="#7") { // 输 入 字符 ， 若 不 是 结束 符 则 循环 
if(ch!="@") { // 非 虚 结 点 ， 建 立新 结 点 


S=new node; 
Ss—>data=ch; 
s—->lchild=s->rchild=NULL; 
} 
else s=NULL; 


rear++;Q[rear]=s; // 不 管 结 点 是 否 为 虚 ， 都 要 入 队 
if(rear==1) {root=s;front=1;} // 第 一 个 结 点 是 根 ， 要 修改 头 指针 , 它 不 是 孩子 
else { 
if(s && Q[front]) / /孩子 和 双亲 都 不 是 虚 结 点 ， 链 接 之 
if(rear%2==0) Q[front]->lchild=s;  //rear 是 偶数 ， 新 结 点 是 左 孩 子 
else Q[front]->rchild=s; //rear 是 奇数 ， 新 结 点 是 右 护 子 
if (rear%2==1) front++; / /不论 是 否 为 虚 ， 右 孩子 入 队 后 ， 双 亲 出 队 


} 
} 
return root; 


} 


2. 先 根 、 中 根 或 后 根 遍历 序列 

基本 思想 是 输入 这 3 个 遍历 序列 中 的 一 个 ， 二 又 树 的 结 点 就 按 相 应 的 遍历 过 程 逐 个 生 
成 。 类 似 于 层 序 届 历 ， 如 果 不 对 遍历 序列 作 些 补充 ， 是 不 能 完整 地 反映 结 点 间 的 逻辑 关系 
的 ， 也 惑 不 能 得 到 正确 的 结果 。 补 充 的 方法 也 是 增加 虚 结 点 ， 但 这 里 只 需 对 衬 指 针对 应 的 
位 置 进行 补 序 ， 而 不 必 补 序 到 完全 二 叉 树 的 形式 。 

以 先 根 遍历 和 图 $.12(a ) 为 例 , 二 又 树 的 先 根 输入 序列 为 ABDQFQQOEGQQQCQQ， 


其 中 @ 表 示 虚 结 点 。 注 意 ， 这 里 不 需要 结束 符 。 算 法 过 程 为 ， 先 生成 根 结 点 ， 再 生成 左 子 
bitree pre creat() { // 由 先 根 序 列 建立 二 叉 树 ， 返 回 根 指针 
bitree 七 ” 
Char ch; 
ET， 
if (ch==’@’) return NULL; // 虚 结 点 
t=new node; // 生 成 根 结 点 
t—>data=ch; 


t->lchild=pre creat () ; // 生 成 左 子 树 
t->rchild=pre creat () ; // 生 成 右 子 树 
return t; 

} 


该 算法 的 调用 形式 为 “bitree T; T=pre creat0;” 等 。 

耕 给 定 的 是 后 根 序列 ， 由 于 第 一 个 结 点 就 是 虚 结 点 ， 为 递归 出 口 ， 于 是 后 面 递 归 体 一 
次 也 不 会 执行 ， 从 而 生成 不 了 二 又 树 。 但 把 序列 倒 过 来 看 ， 则 相当 于 按 “ 根 一 右 一 左 ” 的 
顺序 裔 历 原 二 又 树 ， 于 是 可 把 原 序 列 逆 置 后 ， 按 “ 根 一 右 一 左 ” 的 “ 先 根 遍历 ”来 生成 二 
叉 树 。 只 体 算 法 略 。 但 是 ， 大 给 定 的 是 中 根 序 列 ， 除 了 第 一 个 结 点 为 虚 结 点 的 问题 外 ， 更 
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主要 是 因为 不 能 确定 谁 是 根 ， 二 又 树 不 唯一 ， 从 而 不 能 生成 二 又 树 。 

3. 双人 遍历 序列 

上 和 耐看 到 ， 单 个 的 遍历 序列 一 般 需 要 补充 虚 结 点 才能 完整 表示 结 点 间 的 逻辑 关系 。 但 
两 个 或 多 个 信息 不 完整 的 序列 如 果 能 相互 补充， 也 可 能 得 到 完整 的 信息 。 这 需要 分 析 和 利 
用 人 遍历 序列 的 特点 。 由 遍历 方法 得 到 以 下 几 点 是 显然 的 : 

(1) 对 前 序 序列 ， 序 列 的 第 一 个 结 点 就 是 整个 二 又 树 的 根 。 

(2) 对 后 序 序列 ， 序 列 的 最 后 一 个 结 点 就 是 整个 二 又 树 的 根 。 

(3) 对 中 序 序列 ， 以 根 为 界 ， 序列 的 前 一 部 分 为 根 的 左 子 树 ， 后 一 部 分 为 根 的 右 子 树 ; 
并 且 ， 由 前 一 部 分 构成 的 子 序列 是 左 子 树 的 中 序 序列 ， 由 后 一 部 分 构成 的 子 序列 是 右 子 树 
的 中 序 序列 。 

若 给 定 了 前 序 序列 和 中 序 序列 ， 反 复 利 用 上 面 的 (1) 和 “(3)， 就 可 获得 完整 的 逻辑 
信息 ， 即 由 前 序 序列 找到 根 ， 由 中 序 序列 得 到 左 、 右 子 树 ， 再 对 每 个 子 树 由 前 序 序列 找到 


子 树 的 根 ， 由 中 序 序列 得 到 子 树 的 左 、 右 子 树 ， ee ， 依 此 类 推 ， 每 次 得 到 一 个 结 点 < 
树 的 根 )， 从 而 逐渐 分 离 出 树 的 全 部 信息 ， 也 束 可 以 还 原 和 构造 出 该 二 叉 树 。 这 个 过 程 参 见 
图 5.16。 


前 序 遍历 序列 : 要 ” 左 子 树 要 ” 右 子 树 
ps J 有 pe 


所 人 
中 序 遍 历 序列 : 
1S 1 1e 


图 5.16 由 前 序 和 中 序 序列 建立 二 又 树 
由 于 构造 过 程 是 递归 的 ， 可 方便 地 写 出 相应 的 递归 算法 : 


bitree creat (char Prel[l],int ps,int pe,char In[],int is,int ie) { 
// 由 先 序 和 中 序 建立 二 义 树 ，Pre[] 和 In[] 为 遍历 序列 ，ps,pe 以 及 is,ie 分 别 为 区 间 始 末 点 
bitree t; 
i 工 》 
if (ps>pe) return NULL; 
t=new node; // 生 成 根 结 点 
t—->data=Prelps]; 
1=1S; 
while (In[i]!=Pre[ps]) i++;  ”// 寻 找 中 序 序列 中 根 的 位 置 i 
t->lchild=creat (Pre,ps+1,ps+i-is,In,is,i-l1); // 生 成 左 子 树 
t->rchild=creat (Pre,ps+i-is+l,pe,In,i+l1,ie); // 生 成 右 子 树 
return t; 


} 
注意 ， 在 递归 中 要 用 参数 指明 当前 正在 处 理 的 子 树 的 中 序 与 前 序 序列 在 原来 整个 中 序 
与 前 序 序列 中 的 位 置 。 


一 般 地 ， 由 中 序 序列 与 前 序 序列 、 中 序 序列 与 后 序 序列 、 中 序 序列 与 层 序 序列 等 都 能 
唯一 确定 二 又 树 。 而 由 前 序 序列 和 后 序 序列 因 不 能 确定 左右 子 树 ， 一 般 就 不 能 唯一 确定 二 
又 树 〈 除 非 二 又 树 为 空 或 上 只 有 一 个 结 点 ; 或 补充 其 他 条 件 如 为 严格 二 又 树 等 )。 比 如 由 前 序 
序列 {A, B, D, C} 和 后 序 序列 {D, B, C,A} 可 得 到 如 图 5.17 所 示 的 两 柠 二 又 树 。 


B 0B) ©) 
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图 5.17 前 序 序列 和 后 序 序列 分 别 相同 两 棵 二 又 树 


如 果 要 把 一 柠 二 又 树 存 储 到 外 存 〈 文 件 ) 中 ， 我 们 就 可 只 存储 它 的 中 序 序列 与 前 序 序 
列 ， 或 者 中 序 序列 与 后 序 序列 等 ， 以 后 在 需要 时 再 将 二 文 树 还 原 出 来 。 这 样 ， 既 不 必 像 顺 
序 存储 那样 ， 存 储 大 量 虚 结 点 ， 又 不 必 像 二 又 链表 那样 ， 存 储 大 量 附加 指针 。 因 此 ， 也 可 
看 成 是 二 又 树 的 一 种 存储 方法 。 


65 递归 消除 


在 5.3.1 市 中 ， 我 们 由 遍历 的 递归 定义 直接 写 出 了 志 历 的 递归 算法 。 一 般 地 ， 对 一 个 
递归 问题 ， 设 计 出 求解 该 问题 的 递归 算法 是 比较 容易 的 ， 并 且 一 般 也 有 较 好 的 可 读 性 。 然 
而 ， 有 时 需要 考虑 怎样 将 一 个 递归 算法 转换 成 等 价 的 非 递归 算法 ， 这 称 为 “ 递 归 消 除 
(recursion removal) ”。 研 究 递 归 消 除 的 原因 主要 有 以 下 几 个 方面 : 

第 一 ， 递 归 消 除 有 利于 提高 算法 的 时 空 性 能 。 一 般 而 言 ， 递 归 算 法 的 时 空 性 能 相对 较 
差 ， 非 递归 算法 的 时 衬 性 能 要 凯 得 多 。 比 如 ， 递 归程 序 执行 时 需 反 复 调 用 目 己 ， 与 调用 其 
他 函数 一 样 ， 每 调用 一 次 ， 系统 就 在 其 运行 栈 中 存放 函数 的 返回 地 址 、 参 数 、 临 时 变量 等 ， 
随 看 递归 的 进行 ， 运行 栈 不 断 增长 ， 只 有 当 函 数 彻 抵 执 行 完 后 , 才 释 放 它 所 占用 的 栈 罕 间 。 
因此 ， 递 归 算 法 不 但 不 节省 空间 ， 而 且 一 般 还 比 非 递 归 算法 滔 费 空间 。 如 果 某 个 递归 算法 
的 时 空 性 能 较 差 ， 又 要 被 频 索 地 使 用 ， 则 将 它 转 换 为 非 递归 算法 的 意义 融 更 大 了 。 

第 二 ， 研 究 递归 消除 有 助 于 透彻 理解 递归 机 制 ， 而 这 种 理解 是 熟练 掌握 递归 程序 设计 
技能 的 必要 前 所。 

第 三 ， 有 些 程序 设计 语言 不 允许 递归 ， 如 FORITRAN 等 高 级 语言 和 大 多 数 汇 编 语 言 ， 
这 时 就 不 得 不 考虑 非 递 归 算 法 。 

一 般 说 来 , 如 果 将 原来 由 系统 管理 的 递归 程序 的 工作 过 程 (主要 是 工作 栈 的 工作 过 程 ) 
改 为 由 程序 员 来 模拟 和 管理 ， 都 可 实现 递归 消除 ， 但 这 并 不 是 说 递归 消除 一 定 要 利用 栈 ; 
即使 要 用 栈 ， 也 不 一 定 要 将 工作 栈 的 工作 过 程 都 模拟 出 来 ， 比 如 ， 大 保存 的 现场 信息 在 返 
回 后 不 绸 使 用 ， 则 可 不 必 保 存 ， 从 而 提高 程序 效率 。 本 区 根据 是 个 需要 引入 工作 栈 作为 控 
制 机 构 ， 将 递归 消除 技术 分 成 两 类 加 以 讨论 。 


5.5.1 简单 违 归 消 除 


对 于 简单 的 递归 算法 ， 可 以 不 通过 工作 栈 作 控制 机 制 而 直接 转换 成 循环 算法 。 这 时 计 
算 依赖 图 〈 函 数 调用 关系 图 ) 的 分 析 和 化 简 是 一 种 非常 有 用 的 辅助 手段 。 下 面 通过 两 个 例 
子 来 进行 说 明 。 

例 5.6 “将 计算 阶乘 ml 的 递归 算法 转换 成 非 递 归 算 法 。 
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解 : 求 阶乘 的 递归 算法 为 : 

long f(int n) { 
TO Teturn 1s: 
else return n*f (nl1); 


} 

计算 依赖 图 的 画 法 是 :对 每 一 个 递归 调用 ， 在 图 中 用 一 个 结 点 来 表示 ; 对 任意 两 个 递 
归 调 用 p、q， 大 p 的 计算 直接 依赖 于 q， 即 p 的 执行 中 调用 了 q， 则 在 p 和 9g 之 间 男 一 条 
线 ， 并 且 p 点 的 位 置 高 于 q 点 。 通 常 只 能 且 只 需 画 出 计算 依赖 图 的 一 部 分 。 

对 于 计算 nl! 的 递归 算法 f(n) 来 说 ， 以 n=3 为 例 ，f(3) 的 计 ， 
算 直 接 依 赖 于 KK2)， 因 为 ff3) 调 用 了 f2)， 仅 当 f2) 的 计算 完 : 13) ) ， 
成 之 后 ，f(3) 的 计算 才能 完成 。 类 似 地 ，f(2) 直 接 依 赖 于 f(1); 7 (CT ) ， 
f(1) 直 接 依赖 于 KO)， 而 Ko) 不 依赖 于 其 他 调用 ， 计 算 由 自己 ; 时 
独立 完成 。 包 含 这 几 个 递归 调用 的 计算 依赖 图 如 图 5.18 所 示 。 | 
图 中 虚线 表示 递归 调用 和 返回 的 次 序 ， 向 下 的 箭头 表示 递归 SR 
调用 ;向 上 的 箭头 表示 返回 。 根 据 计 算 依赖 图 的 画 法 和 含义 ， ee 
这 些 虚 线 和 箭头 可 以 省 略 。 图 5.18 fn) 的 部 分 计算 依赖 图 


对 照 图 3.6 (a) 不 难看 出 ， 图 5.18 只 不 过 是 它 的 一 种 简化 形式 。 事 实 上 ， 计 算 依赖 图 
集中 反映 了 不 同 递归 调用 之 间 的 依赖 关系 。 通 过 对 这 种 关系 的 分 析 ， 可 以 很 方便 地 写 出 完 
成 同样 任务 的 循环 算法 。 

从 图 5.18 中 可 以 明显 看 出 ， 递 归 算 法 fm) 的 计算 实际 上 由 一 个 目 上 而 下 的 递归 调用 阶 
段 和 一 个 目下 而 上 的 返回 阶段 构成 ; 并 且 所 有 递归 调用 都 直接 或 间接 地 依赖 于 f(0)。 因 此 ， 
整个 计算 完全 可 以 只 由 后 一 个 阶段 完成 ， 即 先后 依次 计算 f(0)、f(1)、f(2)、…、f(n)。 这 是 
一 个 弟 推 (recurrence) 过 程 ， 可 用 循环 完成 。 引 入 一 个 工作 变量 记录 中 间 结 果 ， 则 计算 nl 
的 循环 算法 为 : 

long fl(int n) { 

long x; 

10t 13 

x=]; 

for (i=1;1i<=n;1i++) X=x*1; 


return x; 


} 


显然 ， 该 算法 的 时 间 复 杂 上 度 为 O(n)。 
作为 对 比 , 这 里 分 析 一 下 前 面 的 递归 算法 fm)。 在 求 fn) 时 需 先 求 fn-1); 若 已 知 fn-1)， 
则 其 他 运算 (乘法 和 人 返回) 的 时 间 为 常量 ， 设 为 c， 即 Tn)=T(n-1)+c， 但 n=0 时 不 递归 和 直 
接 返 回 结 果 ， 执 行 时 间 也 为 常量 ， 设 为 d， 即 T(0)=d。 于 是 : 
Tm)=Tm—D)+c =[T(n—2)+cl+c 
=T(n—2)+2c=[T(n—3)+cl+2c 
=T(n—3)+3c=-… 
=T(0)+nc 
=d+nc = O(n) 


可 见 这 里 递归 和 非 北 归 算法 的 时 间 复 杂 上 度 相 同 ,但 显然 非 人 递归 算法 没有 函数 调用 和 返 


回 等 时 空 开销 ， 其 实际 执行 效率 要 局 些 。 

上 述 问 题 比较 体 单 ， 计 算 依赖 图 中 没有 分 文 〈 单 同 通 归 )， 上 是 化 归 调用 语句 是 递归 程 
序 的 最 后 一 句 ( 尾 吉 归 ), 熟练 后 这 类 问题 可 不 画 计 算 依赖 图 而 直接 用 循环 消除 递归 (得 到 
迭 代 得 法 )。 在 较 复 杂 的 情况 下 ， 计 算 依 赖 图 为 递归 消除 提供 了 一 种 直观 的 分 析 工 具 。 

例 $.7 写 出 计算 菲 流 那 剖 数列 的 递归 函数 并 消除 递归 : 


0 
Fib(n)=31 中 三 
Fib(m—1)+Fib(m—2) nn>l 


解 : 由 于 Fib(o) 是 递归 定义 的 ， 可 直接 写 出 它 的 递归 算法 如 下 : 


了 和 站 fnE ny # 
了 二 (neO retourn 0 
SlLse 1 于 (ET etaorn 1 
else return f (nl1)+f (n—2); 
} 


n=$ 时 算法 fl(n) 的 计算 依赖 图 见 图 5.19 (a) 所 示 。 显 然 ，f(n) 的 计算 依赖 关系 是 一 个 
树 形 结 构 , 树 上 每 个 结 点 的 计算 直接 依赖 于 其 所 有 孩 子 , 并 和 直接 或 间接 依赖 于 其 所 有 子孙 。 


(c) 计算 依赖 图 (b) 的 简化 (d) 计算 依赖 图 (c) 的 简化 (e) 循环 算法 的 计算 轨迹 


图 5.19 算法 fn) 的 部 分 计算 依赖 图 及 其 简化 


从 图 5.19 (a) 可 以 看 出 ， 递 归 算 法 fm) 的 效率 不 高 。 其 中 ，f3) 被 计算 了 两 次 ，f2) 
被 计算 3 次 ， fl) 和 f(0) 分 别 被 计算 5 次 和 3 次 。 可 以 证 明 (类似 附录 EE 中 菲 波 那 契 数 列 通 
项 的 推导 )， 计 算 fn) 时 所 有 递归 调用 的 总 次 数 为 指数 级 O(2”)， 效 率 是 非常 低 的 。 


显然 ， 如 果 能 把 重复 的 结 点 合并 在 一 起 ， 就 可 避免 重复 计算 ， 从 而 提高 效率 。 这 可 目 
上 而 下 地 按 下 列 步 又 得 到 : 第 一 步 ， 将 两 个 f3) 结 点 合并 ， 得 到 子 图 \b) 所 示 的 计算 依赖 
图 ; 其 次 ， 将 子 图 (b) 中 的 两 个 f(2) 结 点 合并 得 子 图 (c); 最 后 ， 将 子 图 (c) 中 的 两 个 
人 1) 结 点 合并 ， 得 到 子 图 〈d)。 这 个 过 程 就 是 计算 依赖 图 的 化 向。 


由 图 $5.19 〈d) 可知 ， 当 n<5 时 ，fm) 的 全 部 计算 只 依赖 于 人 0) 和 娘 1)。 易 知 此 结果 对 
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任意 n=2 都 成 立 。 因 此 ，f(n) 的 计算 可 以 通过 目下 而 上 的 循环 算法 完成 ， 相 应 的 计算 轨迹 
可 设计 成 子 图 (e》 中 的 虚线 。 由 于 当 n=2 时 ， 每 个 fo) 直接 依赖 于 刚刚 计算 出 的 前 两 个 
值 ， 故 引入 两 个 工作 量 x、y 分 别 记 录 中 间 结 采 。 有 具体 算法 如 下 : 


int fl(Int n) { 
0 RL 
1f (n==0}) return 0s: 
1 (= return 1 
X=07 y=1; 
for(is271<=n?144}) 1 
Zz=x+y; 
x=y; y=2; 
} 
return zZ; 


} 


在 计算 ftn) 的 过 程 中 ， 对 每 个 f@) (i=0, 1, …, n)， 此 算法 只 计算 一 次 ， 故 其 时 间 性 能 
明显 高 于 递归 算法 fn)。 

一 般 地 , 计算 依赖 图 都 可 看 成 树 型 结构 (图 5.18 为 单 文 树 ), 故 也 和 津 称 递归 树 (Recursion 
Tree)， 它 是 分 析 递 归 算 法 的 一 个 重要 工具 ， 如 树 的 局 上 度 对 应 递归 深度 ， 决 定 了 递归 所 需 栈 
空间 的 大 小 ; 树 中 结 点 数 对 应 递归 调用 次 数 ， 决 定 了 递归 所 需 时 间 的 多 少 等 。 


5.5.2 ”基于 栈 的 递归 消除 


在 很 多 情况 下 ， 递 归 算法 的 计算 依赖 图 无 法 简化 成 线性 结构 〈 如 图 5.18) 或 准 线性 结 
构 ( 如 图 5.19(d))， 因 而 无 法 直接 转换 成 循环 算法 。 例 如 ， 从 表面 上 看 ， 二 又 树 的 3 种 
遍历 的 递归 算法 与 计算 fl(n) 的 递归 算法 似乎 并 无 太 大 的 区 别 ， 只 是 过 程 体 中 包含 两 处 递归 
调用 。 然 而 ， 遍 历 算 法 的 计算 依赖 图 是 不 能 简化 的 ， 比 如 在 图 5.13 〈c) 和 图 5.14 中 ， 各 
分 文 结 点 的 实 参 实际 上 是 不 同 的 (对 应 二 又 树 上 的 不 同 结 点 )， 故 不 能 合并 化 条。 其 中 ,图 
5.14 正 是 先 根 遍 历 算法 的 计算 依赖 图 。 

在 这 种 情况 下 ， 通 常 引 入 一 个 工作 栈 作为 控制 机 构 以 消除 递归 。 在 例 3.3 中 曾 提 到 ， 
编译 系统 利用 工作 栈 来 保存 返回 位 置 以 实现 过 程 调 用 与 返回 控制 ， 这 一 思想 同样 适用 于 递 
归 消 除 。 下 面 以 先 根 遍历 〈 以 下 用 pre 表示 ) 为 例 ， 具 体 讨论 如 何 用 工作 栈 来 消除 递归 。 

首先 要 弄 清 工作 栈 的 作用 方式 ， 即 工作 栈 怎样 控制 先 根 饥 历 的 走 问 。 图 5.20 (a) 所 示 
为 二 又 链 表 上 的 任 一 结 点 X 以 及 它 的 左 、 右 子 树 Xr 和 Xr。 假设 t 是 指向 结 点 x 的 指针 ， 
则 与 子 图 (a) 相应 的 有 关 递 归 调 用 如 子 图 (b) 所 示 。 由 于 是 先 根 遍历 ， 当 遍历 到 结 点 x 
时 ， 即 执行 pre(t) 时 ， 有 3 项 工作 需 顺 序 完 成 : 

(1) 访问 结 点 x〈 子 树 的 根 )。 

(2) 遍历 Xr， 即 调用 pre(t->lchild)。 

(3) 人 遍历 Xk， 即 调用 pre(t->rchild)。 

其 中 ，(1) 和 (2) 的 连接 没有 问题 ,但 (2) 与 (3) 如 何 连 接 需 要 考虑 。 为 了 执行 
(3)， 必 须知 道 Xs 的 根 指针 ， 即 结 点 x 的 右 指 针 t->rchild; 但 x 的 左 子 树 Xr 上 并 没有 这 
个 指针 。 所 以 在 执行 (2) 之 前 应 将 指针 t->rchild 保存 起 来 ; 在 任务 (2) 完成 之 后 再 取出 
该 指针 以 执行 任务 (3)。 此 后 ， 指 针 t->rchild 就 没有 保存 价值 了 。 对 于 先 根 遍 历来 说 ， 完 成 
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了 任务 (3) 也 就 完成 了 对 以 结 点 x 为 根 的 整个 子 树 的 壳 历 ， 接 下 来 便 是 退回 到 x 的 父 结 点 。 
， 返 回 prett) 
QD 访问 结 点 x ,2 4 
A Re ~ Se pre(t—>Ichild) pre(t—>rchild) 
加 遍历 左 子 树 / 、@ 遍 历 右 子 树 / A 有 
(a) a (b)》 对 应 的 先 根 遍历 递归 调用 
图 5.20” 先 根 遍 历 的 分 析 

在 整个 过 历 过 程 中 ， 较 后 访问 的 结 点 在 以 后 返回 时 较 先 返回 ， 相 应 地 ， 其 右 子 树 也 较 
先 访问 。 上 所 以 应 以 栈 的 方式 保存 结 点 信息 。 

以 上 保存 的 是 t->rchild。 也 可 保存 结 点 本 喘 的 地 址 t， 以 后 再 通过 人 >rchild 访问 其 右 
子 树 ， 但 显然 不 及 前 者 好 。3 引 入 工作 栈 后 ， 非 递归 算法 在 二 又 链表 的 任 一 结 点 x 上 的 主要 
操作 步骤 可 归纳 如 下 : 

(1) 大 结 点 X 不 空 ， 则 访问 结 点 X:， visit(p)。 

(2) 结 点 x 的 右 指 针 进 栈 : push(p 一 >rchild)。 


(3) 遍历 Xi: p=p->lchild， 转 (1)。 

(4) 退 栈 ， 从 栈 中 得 到 x 的 右 指针 : pop(p)。 

(5) 遍历 Xr: 转 (1)。 

由 于 子 树 也 是 二 叉 树 ， 所 以 步骤 (3)、($) 对 子 树 的 操作 即将 流程 控制 转 (1)。 对 图 
5.21 (a) 所 示 的 二 又 链表 ， 按 上 述 步 又 执行 的 主要 过 程 如 图 5.21 (b) 一 图 $.21 (k) 所 示 。 
图 中 lchild 和 rchild 分 别 缩写 为 1 和 上 T。 


二 >| 一 >| 一 >r | NU 


_t>F>r |E 
/TET\ C * t->r |c 
访问 A 访问 B 访问 D 退 栈 再 退 栈 
ADIN [eI A 的 右 指针 进 栈 ”B 的 右 指针 进 栈 ” D 的 右 指针 进 栈 “得 到 空 指针 ed 
Ca (b) ey (d) ka 
toi | | n 
访问 E 退 栈 再 退 栈 访问 C 
E 的 右 指针 进 栈 ”得 到 空 指针 得 到 C 指 针 C 的 右 指针 进 栈 
(g) (h) (i) (j) (k) 


5.21 先 根 遍历 的 工作 栈 状 态 变 化 示例 


从 中 可 见 ， 在 执行 过 程 中 可 能 多 次 出 现 栈 空 ， 但 中 间 几 次 栈 空 时 取出 来 的 指针 不 空 ， 
只 有 最 后 栈 空 且 取出 来 的 指针 也 空 时 才 终 止 算法 。 整 个 算法 如 下 : 
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void preorder (bitree t) { // 先 根 遍 历 算法 ， 非 递归 


pointer p,Ss[maxsize]; / /顺序 栈 
int top; // 栈 项 指针 
1f (t=OULLI) returns 

top=—1; 

p=t; 


while(! (p==NULL && 七 op==-1)) { 
while(p!=NULL) { 


visit to)s // 访 问 根 
S[++top]=p->rchild; // 右 指针 入 栈 
p=p->lchild; // 回 左 搜索 
} 
p=S [top-——]; 
} 
} 
该 算法 的 遍历 过 程 如 下 : 从 根 开 始 ， 顺 左 分 文 往 下 搜索 ， 每 搜索 到 一 个 结 点 ， 就 访问 
该 结 点 ， 同 时 将 其 右 指针 进 栈 ， 直 到 左 分 支 为 空 。 然 后 ， 退 栈 ， 取 出 最 近 保 存 的 一 个 右 指 


针 ， 如 宁 为 空 ， 绸 退 栈 取出 邦 一 个 右 指针 ; 售 则 对 右 指 针对 应 的 右 子 树 进 行 同样 处 理 。 如 
此 一 直 进 行 下 去 ， 直 到 所 有 结 点 均 已 处 理 完 。 其 中 ， 退 栈 及 其 以 后 的 操作 ， 对 应 于 递归 过 
历 算 法 中 ， 返 回 到 已 搜索 过 的 最 近 一 个 〈 有 右 孩 子 的) 结 点 ， 然 后 再 对 其 右 子 树 进行 递归 


处 理 的 过 程 。 
该 算法 最 先 访问 的 是 根 ， 它 的 处 理 与 其 他 结 点 是 有 上 所 不 同 的 : 根 的 值 是 直接 给 定 的 ， 
其 他 结 点 的 值 则 是 循环 中 从 栈 或 左 指针 得 到 的 。 为 使 根 和 其 他 结 点 的 处 理 方式 一 致 ， 并 人 
化 循环 条 件 ， 可 采用 预 入 栈 技术 ， 即 在 算法 开始 时 先 将 根 结 点 入 栈 ， 然 后 马上 出 栈 进行 有 
关 处 理 ， 整 个 算法 相当 于 从 上 述 步骤 (4) 开始 。 非 形式 算法 和 求 精 后 的 算法 如 下 : 
push ( 根 指 针 ) ; 
while ( 栈 不 空 ) { 
pop (指针 p); 
while(p!=NULL) { 
访问 p; 


push (p->rchild); 
p=p—>lchild; 
} 
} 


void preorder2 (bitree t) { // 先 根 遍 历 算 法 ， 非 递归 ， 根 预 入 栈 


pointer p,S [maxsize]:; // 顺 序 栈 
int top; // 栈 顶 指针 
1 (t==NNULL) Teturns 
top=—1; 
S[++top]=t; // 根 指针 入 栈 
while (top>=0) { // 栈 非 空 
p=S [top--] ; // 出 栈 
while(p!=NULL) { 
visit (p); // 访 问 根 
S[++top]=p->rchildgd; // 右 指针 入 栈 
p=p->lchild; // 问 左 搜索 


} 
} 
} 


注意 ， 对 该 算法 ， 在 图 5.21 (b) 之 前 还 有 一 个 根 指针 进 栈 和 出 栈 的 过 程 。 
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如 果 将 算法 中 的 赋值 语句 p=p->lchild 通过 栈 来 等 效 完成 S[++Htop]=p->lchild ， 
p-S[top--]， 并 注意 到 空 指针 不 必 入 栈 ， 则 上 述 算法 的 两 个 循环 可 合 为 一 个 ， 算 法 如 下 : 
void preorder3 (bitree t) { // 先 根 遍 历 算法 ， 非 递归 ， 根 预 入 栈 ， 改 进 


pointer p,S[maxsize]:; // 顺 序 栈 

int top; // 栈 项 指针 

1f (t=—=NULDL} returns 

top=—1; 

S[++top]=t; // 根 指针 入 栈 

while (top>=0) { // 栈 非 空 
p=S [top——]; // 出 栈 
visit (p); / /访问 根 


if (p->rchild!=NULL) S[++top]=p->rchild; // 右 指针 入 栈 
if(p->Lchild!=NULL) S[++top]=p->lchild; // 左 指针 入 栈 
} 
} 


中 序 壳 历 的 非 递归 算法 也 很 容易 。 中 序 壳 历时， 要 先 访 问 左 子 树 ， 所 以 每 搜索 到 一 个 
结 点 时 并 不 立即 访问 它 ， 只 有 左 子 树 访 问 完 后 下 一 步 才 访问 根 。 于 是 ， 对 搜索 到 的 每 一 个 
结 点 ， 应 当 保存 (入校 ) 当前 结 点 自己 的 指针 《而 不 是 其 右 指针 )， 以 便 搜索 回 退 时 得 到 需 
要 的 返回 位 置 〈 出 栈 )， 再 访问 之 。 算 法 如 下 : 

void inorder (bitree t) {  // 中 根 遍 历 算法 ， 非 递归 


pointer p,s[maxsize]; / /顺序 栈 
int top; // 栈 项 指针 
1f (t==NULL) returns 
top=—1; 
p=t; 
while(! (p==NULL && top==-—1)) { 
while (p!=NULL) { / /搜索 到 最 左下 的 结 点 


S[++top]=p; 
p=p-—>lchild; 


} 
ESLlCop——|? 
visit (p); // 访 问 根 
p=p->Frchild; // 回 右 搜索 
} 
} 
后 序 允 历 的 非 递归 算法 要 复杂 一 些 。 在 后 序 壳 历时， 最 后 访问 根 结 点 ， 所 以 对 任 一 结 
点 ， 应 先 沿 它 的 左 分 文 往 下 搜索 ， 每 搜索 到 一 个 结 点 就 进 栈 ， 直 到 左 分 校 为 空 ; 然后 退 栈 ， 
取出 最 后 入 栈 的 结 点 X， 但 此 时 并 不 访问 它 ， 而 是 从 该 结 点 的 右 分 文 〈 有 有 的 话 ) 的 根 开 


人 ， 按 同样 的 方法 沿 它 的 右 分 校 处 理 ， 处 理 完结 点 x 的 右 分 枝 后 才能 访问 结 点 x。 
因此 ， 任 一 结 点 进 栈 后 ， 都 有 两 次 退回 到 栈 项 : 第 一 次 是 在 处 理 完 它 的 左 分 文 时， 第 
二 光 是 在 处 理 完 它 的 右 分 校 时 。 显 然 , 根 结 点 只 有 在 第 二 次 退回 到 栈 项 时 才 出 栈 并 访问 它 。 
为 了 区 分 是 第 几 次 退回 到 栈 项 ， 一 般 有 两 种 方法 。 
(1) 检 得 一 下 刚 访 问 的 结 点 是 否 是 栈 项 的 右 孩 和子， 算法 如 下 : 
void postorder (bitree t) {// 后 根 遍 历 ， 非 递归 ， 无 进 栈 标志 
pointer p,q,S[maxsize];  // 顺 序 栈 


int top; 
if (t==NULL) returns 
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top=-—1; 
p=t; q=NULL; // 左 子 树 尚未 遍历 ， 最 近 已 访问 结 点 q 为 空 
while(! (p==NULL && top==-1)) { 
while(p!=NULL) { 
S[++top]=p; 


p=p->lchilgd; // 问 左 搜索 
} 
TDP 一 一 // 退 栈 
1if (q!=p->rchild) { 
S[++top]=p; // 再 进 栈 
p=p->rchild; // 转 右 子 树 
q=NULL; // 硬 子 树 尚未 遍历 ， 最 近 已 访问 结 点 gq 为 空 
} 
else { 


cout<<p->data<<" "<<endl; // 访 问 根 
gq=p; p=NULL; 
} 
} 
} 


其 中 ，q 记录 左 子 树 或 右 子 树 最 近 已 访问 过 的 结 点 〈( 子 树 还 未 访问 时 q 为 衬 )。 另 外 ， 
再 进 栈 过 程 可 省 ， 改 为 先 检测 栈 顶 ( 取 栈 顶 )， 而 不 是 先 退 栈 。 这 里 是 为 了 与 下 述 采 用 标志 
flag 的 算法 结构 上 一 致 。 
(2) 为 每 个 结 点 设 个 进 栈 标志 fag， 并 随 结 点 一 起 进出 栈 。 非 形式 算法 如 下 : 
p= 根 ; 
while ( 结 点 未 遍历 完 ) { 
while (p 非 空 ) {push (p, flag=1) ;p=p->lchild;} // 问 左 搜索 


pop (p, flag); // 退 栈 
if(flag==1) {push (p, flag=2) ;p=p->rchild;}  // 再 进 栈 ， 转 右 子 树 
else {Visit(p) ;p=NULL;} // 访 问 根 


} 


其 中 访问 根 后 ， 置 p=NULL 是 为 了 下 一 步 继 续 退 栈 ( 回 退 )。 这 里 入 栈 元 素 是 一 个 结 
构 体 : (指针 , fag)， 也 可 单独 设 标志 栈 ， 并 与 结 点 栈 同 步 进出 。 算 法 略 〈 略 显 烦琐 )。 

通过 前 述 例子 可 见 ， 工 作 栈 在 消除 递归 中 的 基本 作用 是 提供 一 种 控制 机 制 。 在 非 递归 
算法 执行 过 程 中 的 东 些 关键 时 刻 ， 用 栈 顶 元 素来 “引导 ”下 一 步 操 作 的 “ 走 同 ”。 为 此 必须 
提前 将 有 关 信 息 进 栈 保 存 。 例 如 上 面 先 序 遇 历 的 例子 , 工作 栈 保存 的 是 各 个 结 点 的 右 指针 ， 
也 丈 是 该 结 点 右 子 树 的 根 指针 。 显 然 ， 这 些 根 指针 正 是 先 根 遇 历 递归 算法 中 包 合 的 一 些 递 
归 调 用 的 实 参 ， 这 些 实 参 在 非 北 归 算 法 中 大 不 及 时 保存 就 会 于 失 。 因 此 ， 北 归 算 法 中 的 调 
用 与 返回 控制 被 工作 栈 的 作用 所 取代 ， 从 而 将 递归 算法 转换 成 非 递 归 算法 。 


有 以 下 几 点 需要 注意 : 
(1) 图 5.19 (a) 计算 菲 波 那 外 数 列 的 递归 过 程 可 看 成 二 又 树 的 后 根 壳 历 ， 据 此 也 可 与 
出 利用 栈 的 非 递 归 算法 。 


(2) 由 于 中 序 志 历 和 后 序 志 历时 最 先 访 问 的 不 是 根 ， 所 以 它们 相应 的 非 递 归 算 法 中 没 
有 采用 根 预 入 栈 技术 (也 不 合适 )。 

(3) 以 上 通过 栈 进 行 递 归 消 除 后 算法 变 得 复杂 了 ， 而 时 空 性 能 基本 未 变 《〈 相 当 于 把 系 
统 栈 改 为 人 工 管理 , 可 能 节省 一 些 不 必要 的 操作 , 但 时 间 复 杂 上 度数 量 级 不 变 , 具体 分 析 略 )， 


似乎 意义 不 大 。 这 里 主要 是 介绍 递归 消除 的 原理 。 当 然 ， 对 不 允许 递归 的 语言 就 有 意义 了 。 

(4) 如 条 采用 市 双 杀 指针 的 二 又 链表 ， 递 归 消 除 时 可 不 用 栈 ， 因 为 可 由 双 杀 指针 进行 
回 退 。 对 下 面 将 介绍 的 线索 二 又 树 ， 通 历时 也 可 不 需要 栈 。 另 外 ， 即 使 需要 递归 栈 ， 栈 衬 
间 也 可 不 单独 分 配 ， 而 在 原 结 点 空间 上 就 地 进行 : 在 同 左 下 结 点 搜索 时 ， 每 搜索 到 一 个 结 
点 ， 先 将 其 左 孩子 指针 取出 ， 然 后 在 该 处 存 入 其 双亲 指针 ， 这 样 在 搜索 结束 后 就 可 由 双 杀 
指针 进行 回 退 。 当 然 ， 在 回 退 的 同时 要 恢复 原 孩 子 指针 。 这 些 内 容 束 不 细 述 了 。 
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当 用 二 叉 链 表 作 为 二 叉 树 的 存储 结构 时 ， 因 为 每 个 结 点 中 只 有 指向 其 左 、 右 孩子 结 点 
的 指针 域 ， 所 以 从 任 一 结 点 出 发 只 能 直接 找到 该 结 点 的 左 、 右 孩子 ， 一 般 情 况 下 无 法 直接 
找到 该 结 点 在 某 种 遍历 序列 中 的 前 趋 和 后 继 结 点 。 但 是 ， 若 在 每 个 结 点 中 增加 两 个 指针 域 
来 存放 遍历 序列 的 前 趋 和 后 继 信 息 ， 叉 将 大 大 降低 存储 空间 的 利用 率 。 注 意 到 1n 个 结 点 的 
二 又 链表 中 含有 n+1 个 空 指针 域 ， 于 是 可 利用 这 些 空 指针 域 来 存放 某 种 遍历 次 序 下 的 前 
趋 和 后 继 结 点 的 指针 。 这 种 附加 的 指针 称 为 “线索 ”， 加 上 线索 的 二 又 链 表 称 为 线索 链表 ， 
相应 的 二 又 树 称 为 线索 二 义 树 (Threaded Binary Tree )。 

这 时 ， 结 点 中 的 指针 可 能 指 的 是 孩子 ， 也 可 能 指 的 是 线索 ， 为 了 区 分 ， 可 在 结 点 中 设置 
两 个 线索 标志 位 ， 结 点 结构 为 : 

iehid | ltag | data | rtag | rchid 

其 中 : 

.1 |0 ”lchild 是 指向 结 点 的 左 孩 子 的 指针 

线索 标志 ng 一 | Ichild 是 指向 结 点 的 前 趋 的 左 线索 
rchild 是 指 癌 结 点 的 右 孩 子 的 指针 
rchild 是 指 问 结 点 的 后 继 的 右 线 索 

以 图 5.22 (a) 所 示 的 中 序 线索 二 叉 树 为 例 ， 它 的 线索 链表 见 图 5.22(d)， 其 中 实 线 表示 
指针 ， 虚 线 表 示 线 索 。 其 中 结 点 D 的 左 线索 为 空 ， 表 示 它 是 中 序 序列 的 开始 结 点 ， 没 有 前 趋 ; 
结 点 C 的 右 线索 为 空 ， 表 示 它 是 中 序 序列 的 终端 结 点 ， 没 有 后 继 。 显 然 在 线索 二 又 树 中 ， 一 
个 结 点 为 叶 结 点 的 充 要 条 件 为 : 它 的 左 、 右 线索 标志 均 是 1。 

从 图 5.22 中 可 发 现 如 下 特点 : 中 序 线 索 一 般 都 是 “向 上 ” 指 的 ， 即 指 问 其 祖先 结 点 ; 
而 先 序 和 后 序 线索 就 不 一 定 〈 见 图 5.22 (b) 和 图 $.22〈c))， 可 以 同上 指 ， 也 可 以 癌 下 指 ， 
还 可 以 同 级 指 。 

注意 ， 中 序 线索 链表 中 有 两 个 空 指针 ， 但 先 序 和 后 序 链表 中 不 一 定 只 有 一 个 空 指 针 ， 
也 可 能 有 两 个 空 指 针 〈 可 用 只 有 两 个 结 点 的 二 又 树 进行 验证 )。 

有 时 为 了 某 些 运算 的 方便 ， 也 可 在 线索 二 又 链表 上 附加 头 结 点 : 其 左 指针 或 右 指针 指 
向 根 结 点 ， 另 一 指针 指向 遍历 序列 的 首 结 点 或 尾 结 点 。 进 一 步 ， 如 果 遍 历 序列 的 首 结 点 或 
尾 结 点 的 线索 为 空 ， 还 可 将 它 指 癌 头 结 点 ， 形 成 某 种 “循环 ”链表 。 


、 _ 0 
太 线 过 标志 ag 一 


QD n 个 结 点 共 2n 个 指针 域 ,但 树 中 只 有 on-1 条 边 ,对 应 n-1 个 非 空 指针 , 故 空 指针 数 为 20-(n-1)=n+1。 
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(d) 中 序 线索 链表 
图 5.22 线索 二 又 树 及 其 存储 结构 


以 上 两 个 线索 标志 也 可 合并 为 一 个 tag， 比 如 用 0、1 表示 左 线 索 的 情况 ， 用 3、4 表示 
右 线 索 的 情况 ， 但 不 如 左右 分 开 处 理 俏 便 、 直 观 ; 另外 ， 为 了 区 分 结 点 中 的 指针 指 的 是 孩 
于 还 是 线索 ， 也 可 不 用 标志 位 ， 而 用 负 地 址 表示 : 将 线索 以 负数 的 形式 存放 。 这 样 如 果 指 
针 域 为 正则 指 癌 孩 子 ， 人 否则 表示 线索 。 这 个 方法 不 改变 结 点 的 存储 结构 ， 也 不 耗费 额外 的 
空间 ， 但 指针 类 型 毕 葛 不 是 整数 类 型 ， 在 使 用 时 再 要 进行 类 型 转换 ， 这 会 增加 运行 时 间 。 
将 二 又 树 变 为 线索 二 又 树 的 过 程 称 为 线索 化 。 按 某 种 次 序 将 二 又 树 线索 化 ， 只 要 按 该 
次 序 壳 历 二 叉 树 ， 在 过 有 历 过 程 中 用 线索 取代 空 指针 即 可 。 为 此 ， 可 用 一 个 指针 pre 始终 指 
回 刚 访问 过 的 结 点 , 用 指针 p 指示 当前 正在 访问 的 结 点 。 显 然 , 结 点 *pre 是 结 点 *p 的 前 趋 ， 
而 *p 是 *pre 的 后 继 。 以 中 订 线 索 化 算法 为 例 ， 该 算法 与 中 序 过 历 算 法 类 似 ， 区 别 仅 在 于 访 
问 根 结 点 时 所 做 的 处 理 不 同 。 在 线索 化 算法 中 ， 访 问 当 前 根 结 点 *p 所 做 的 处 理 是 : 
(1) 奎 结 点 *p 为 宇 ， 则 什么 也 不 做 。 
(2) 对 结 点 *p 及 其 前 趋 结 点 *pre 进行 相互 处 理 : 
@ 若 结 点 *p 的 左 子 树 为 空 ， 则 令 p->lchild 为 指向 其 中 序 前 趋 结 点 *pre 的 左 线索 
( 即 p->lchild=pre)， 并 置 左 线索 标志 〈 即 p->ltag=1)。 
@) 在 结 点 *pre 存在 〈 即 prel=NULL )， 且 其 右 子 树 为 空 ， 则 令 pre->rchild 为 指 问 
其 中 序 后 继 结 点 *p 的 右 线 索 ( 即 pre->rchild=p )， 并 置 右 线索 标志 〈 即 
pre—>rtag=1 )。 
(3) 将 pre 指向 刚刚 访问 过 的 结 点 *p( 即 pre=p)。 这 样 ， 在 下 一 次 访问 一 个 新 结 点 *p 
时 ，*pre 为 其 前 趋 结 点 。 
下 和 面 给 出 线索 链表 的 形式 说 明 及 中 序 线 索 化 算法 : 
typedef struct node * pointer; //pointer 类 型 用 于 表示 树 的 一 般 结 点 
struct node { // 结 点 结构 
datatype data; 


pointer lchild,rchild; 
int ltag,rtag; 


} > 


typedef pointer bitree; //bitree 类 型 用 于 表示 树 的 根 结 点 ， 即 表示 树 
pointer pre=NULL; // 全 局 量 ， 初 值 为 NULL 
void inthread(bitree 七 ) { // 中 序 线索 化 


pointer p; 
if (t==NULL) return; 
p=t; 
inthread (p->lchild); // 左 子 树 线索 化 
if (p->lchild==NULL) {p->lchild=pre;p->ltag=1;}  // 对 p 建 左 线索 
if (pre!=NULL && pre—>rchild==NULL) {pre->rchild=p;pre—>rtag=1;} 
// 对 pre 建 右 线索 
pre=p; 
inthread (t->rchild); // 右 子 树 线索 化 
} 
类 似 地 可 得 前 序 线索 化 和 后 序 线索 化 算法 〈 略 ) 。 
建立 了 线索 链表 之 后 ,了 驶 可 讨论 线索 二 又 树 上 的 运算 了 。 下 面 以 中 序 线索 二 又 树 为 例 ， 
介绍 线索 二 又 树 上 两 种 比较 简单 又 常用 的 运算 。 
1. 查找 菏 结 点 *p 的 中 序 前 趋 和 后 继 
但 找 结 点 #p 的 中 序 后 继 结 点 分 两 种 情形 : 
(1) 若 *p 的 右 线索 标志 为 1， 则 p->rchild 为 右 线 索 ， 直 接 指 问 *p 的 中 序 后 继 结 点 。 
(2) 大 Xp 的 右 线 索 标 志 为 0， 则 郑 的 中 序 后 继 要 进行 查找 ， 它 是 郑 的 右 子 树 中 订 通 
历 的 第 一 个 结 点 ， 也 就 是 右 子 树 中 “最 左下 ”的 结 点 。 


但 找 结 点 3p 中 序 后 继 结 点 的 算法 如 下 : 


pointer innext (bitree 七 ) { 
pointer gq; 
if (t—->rtag==1) return(t->rchild); 
q=t—>rchild; 
while (gq—->ltag==0) q=q->lchild; 
return q; 

} 


类 似 ， 查 找 结 点 *p 的 中 序 前 趋 结 点 也 分 两 种 情形 : 

(1) 若 *p 的 左 线索 标志 为 1， 则 p->lchild 为 左 线 索 ， 直 接 指 向 *p 的 中 序 前 趋 结 点 。 

(2) 寿 *p 的 左 线索 标志 为 0， 则 *p 的 中 序 前 趋 要 进行 查找 ， 它 是 *p 的 左 子 树 中 序 壳 
历 的 最 后 一 个 结 点 ， 也 就 是 左 子 树 中 “最 在 下 ”的 结 点 。 

可 见 ， 在 中 序 线索 二 又 树 上 找 某 点 *p 的 中 序 前 趋 和 后 继 都 比较 方便 。 如 果 是 非 线 索 二 
叉 树 ， 则 找 某 点 的 中 序 前 趋 和 后 继 时 ， 只 能 从 根 开 始 进行 中 序 壳 历 。 

然而 ， 在 前 序 线索 链表 中 找 某 点 的 前 序 前 趋 、 在 后 序 线索 链表 中 找 某 点 的 后 序 后 继 并 
不 一 定 方便 (前 者 找 前 序 后 继 、 后 者 找 后 友 前 趋 方便 )。 这 是 因为 要 人 查找 的 前 趋 或 后 继 可 能 
就 是 给 定点 的 双亲 ， 或 在 双 杀 的 另 一 棵 子 树 中 ， 如 果 线 过 标志 为 0， 就 需要 知道 给 定点 的 
双亲 ， 而 找 双 亲 一 般 要 从 根 开 始 进 行 搜 索 (除非 结 点 市 双亲 指针 )。 如 果实 际 问题 正好 只 需 
要 其 中 比较 方便 的 一 个 线索 ， 则 这 类 链表 还 是 有 使 用 价值 的 ， 这 时 只 建 一 个 线索 就 够 了 。 
有 关内 容 就 不 细 述 了 。 

2. 遍历 线索 二 又 树 

这 里 的 遍历 是 指 利 用 线索 进行 的 遍历 。 人 遍历 某 种 线索 二 叉 树 ， 可 从 该 遍历 次 序 下 的 开 
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始 结 点 出 发 ， 反 复 找 结 点 在 该 次 序 下 的 后 继 ， 直 至 终端 结 点 (或 从 该 次 序 下 的 终端 结 点 出 
发 ， 反 复 找 结 点 在 该 次 序 下 的 前 趋 ， 直 全 开始 结 点 )。 以 中 序 线索 二 又 树 的 中 序 过 有 历 为 例 ， 
算法 如 下 : 
intraver (bitree 七 ) { // 遍 历 中 序 线索 二 又 树 
pointer p; 
1 {t==NULD) Teturns // 衬 树 
p=t; 
while (p->ltag==0) p=p->lchild;// 找 中 序 序列 的 开始 结 点 
do { 
cout<<p->data<<end]l; // 访 问 结 点 *p， 假 设 为 输出 结 点 内 容 
p=innext (p); // 找 *p 的 中 序 后 继 结 点 


} while (p!=NULL); 

} 

由 于 中 序 序列 的 终端 结 点 的 后 继 线索 为 空 , 所 以 do 语句 的 终止 条 件 是 p=NULL。 显然 
该 算法 的 时 间 复 杂 度 仍 为 O(n)， 但 常数 因子 比 非 线索 遍历 算法 小 ， 且 无 需 设立 递归 栈 。 因 
此 ， 夺 经 党 要 对 二 又 树 志 历 、 便 找 结 点 或 会 找 结 点 在 指定 次 序 下 的 前 趋 和 后 继 等 ， 采 用 线 
索 二 又 树 较 好 。 

注意 ， 对 前 序 线索 二 又 树 ， 找 前 序 前 趋 不 方便 ， 所 以 过 历 时 应 从 开始 结 点 《最 左下 疆 
点 ) 出 发 ， 按 找 前 序 后 继 的 方式 进行 ， 否 则 并 不 比 直 接 过 有 历 非 线索 二 又 树 有 优势 。 关 似 ， 
对 后 序 线索 二 叉 树 ， 找 后 序 后 继 不 方便 ， 遇 历时 应 从 终端 结 点 〈 根 ) 开始 ， 按 找 后 序 前 趋 
的 方式 进行 。 

上 和 面 介绍 的 两 种 运算 ， 线索 树 均 优 于 非 线 索 树 。 但 如 果 要 在 线索 二 文 树 中 进行 插入 和 
删除 运算 就 不 方便 了 ， 因 为 这 时 除了 修改 指针 外 ， 还 要 修改 相应 的 线索 ， 运 算 量 几乎 与 重 
新 进行 线索 化 相当 。 这 部 分 内 容 就 不 介绍 了 。 


6.7 树 和 森林 


本 节 将 建立 树 、 森 林 和 二 叉 树 的 对 应 关系 ， 并 讨论 树 的 存储 表示 及 其 遍历 。 
5.7.1 树 、 和 森林 与 二 又 树 的 转换 


在 树 或 森林 与 二 又 树 之 间 有 一 个 目 然 的 一 一 对 应 关系 。 任 何 一 个 牺 林 或 一 柠 树 部 可 唯 
一 地 对 应 到 一 标 二 又 树 ， 反 之 ， 任 何 一 柠 二 又 树 也 能 唯一 地 对 应 到 一 个 森林 或 一 柠 树 。 这 
样 ， 对 树 或 森林 的 一 些 操作 就 可 利用 二 又 树 来 实现 。 

1. 树 、 和 森林 到 二 又 树 的 转换 

树 中 每 个 结 点 可 能 有 多 个 孩子 ， 但 二 又 树 中 每 个 结 点 最 多 上 只 能 有 两 个 孩子 。 要 把 树 转 
换 为 二 又 树 ， 就 必须 找到 一 种 结 点 与 结 点 之 间 最 多 1 对 2 的 关系 。 注 意 到 树 中 的 每 个 结 点 
最 多 只 有 一 个 最 左边 的 孩子 (长 子 ) 和 一 个 右 邻 的 兄 第 ， 据 此 我 们 就 能 很 目 然 地 将 树 转换 
成 二 文 树 ， 即 将 各 结 点 的 长 子 变 成 其 左 孩 子 ， 右 元 腊 变 成 其 右 孩 子 ， 如 图 5.23 (a) 所 不。 
转换 后 ， 二 又 树 中 左 分 文 上 相 邻 的 结 点 在 原 树 中 是 父子 关系 ; 右 分 文 上 相 邻 的 结 点 在 原 树 


中 是 兄 第 关系。 由 于 根 结 点 没有 兄弟 ， 所 以 树 转 化 后 二 又 树 的 根 结 点 没有 右 子 树 (为 定 )。 
这 里 要 指出 ， 对 于 无 序 树 ， 结 点 的 孩子 不 分 左右 ， 于 是 谁 是 长 子 、 谁 是 右 兄弟 以 及 整 
个 转换 就 变 得 不 确定 或 不 唯一 。 为 此 我 们 约定 ， 对 一 棵 无 序 树 ， 在 转换 时 ， 就 其 当前 形态 
按 有 序 树 进 行 处 理 。 易 见 ， 这 样 转 换 的 结果 是 唯一 的 。 具 体 转 换 时 可 按 如 下 步骤 进行 : 
(1) 在 所 有 兄弟 结 点 之 间 加 一 连 线 。 
(2) 对 每 个 结 点 ， 除 了 保留 与 其 长 子 的 连 线 外 ， 去 掉 该 结 点 与 其 他 孩子 的 连 线 。 
使 用 上 述 变换 法 ， 图 5.23 (b) 所 示 的 树 就 变 为 图 5.23 〈c) 的 形式 ， 它 已 是 一 棵 二 又 
树 ， 知 将 它 按 顺 时 针 方 向 旋转 约 45” 就 能 更 清楚 地 变 为 图 5.23 (d) 所 示 的 二 又 树 。 
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(a) 转换 原理 (b) 树 (c) 转换 到 二 又 树 (d) 旋转 结果 
图 5.23 树 转 换 为 二 又 树 
将 一 个 森林 转换 为 二 叉 树 的 方法 是 ， 先 将 森林 中 的 每 一 棵 树 变 为 二 又 树 ， 然 后 将 各 二 
又 树 的 根 结 点 视 为 元 脂 连 在 一 起 。 注 总 ， 穆 林 转 化 后 二 又 树 的 根 结 点 有 右 子 树 (m>0 时 )。 
例如 在 图 5.24 中 ， 子 图 (b) 是 子 图 (a) 的 转换 结 末 ， 子 图 〈c) 是 子 图 \b) 旋转 后 的 二 
又 树 。 
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(a) 森林 (b) 转换 到 二 又 树 (c) 旋转 结果 


5.24 ”森林 转换 为 二 又 树 


可 以 给 上 述 转换 方法 做 如 下 形式 定义 : 设 F={Ti, Ts,，…, Tm} 表示 由 树 Ti、T、…、Tn 
组 成 的 森林 ， 则 森林 下 对 应 的 二 又 树 B(F) 为 : 

(1) 若 下 为 空 (m=0)， 则 B(F) 为 空 二 又 树 。 

(2) 奋 上 非 军 Cm>0)， 则 B(F) 的 根 就 是 Ti 的 根 B(F) 的 左 子 树 是 由 Ti 去 挥 根 后 的 子 
树 森 林 Fi={Tia, Ti2，…, Ti 转换 成 的 二 又 树 B(F1); B(F) 的 右 子 树 是 由 森林 F={T;, T3，… 
Twn} 转换 成 的 二 又 树 B(F”)。 由 于 左 子 树 B(F1) 和 右 子 树 B(F”) 本 喘 义 要 由 森林 转换 而 来 ， 故 
整个 转换 过 程 需 要 递归 地 进行 。 

2. 二 义 树 到 树 、 森 林 的 转换 

上 述 树 、 和 森林 到 二 又 树 的 转换 过 程 是 可 逆 的 ， 所 以 反 过 来 便 可 将 二 叉 树 转换 到 树 或 
和 森林， 即将 二 又 树 中 结 点 的 左 孩 子 变 为 其 长 子 ， 右 孩子 变 为 其 右 兄 第 。 具 体 过 程 可 如 下 
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进行 : 

(1) 若菜 结 点 是 其 双亲 的 左 孩 子 ， 则 把 该 结 点 的 右 孩 子 、 右 孩子 的 右 孩 子 、…… ， 都 
与 该 结 点 的 双 杀 用 连 线 连 起 来 。 

(2) 去 抒 原 二 叉 树 中 所 有 双 杀 到 右 孩 子 的 连 线 。 

图 5.25 〈c) 就 是 用 这 种 方法 将 图 5.25 (a) 所 示 的 二 叉 树 处 理 后 的 结果 ， 由 于 原 二 又 
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(b) 转换 到 森林 (c) 最 后 结果 
图 5.25 二 又 树 转 换 为 森林 


5.7.2 ” 树 的 存储 


对 树 而 言 ， 一 般 不 能 采用 顺序 存储 方式 ， 只 能 采用 链 式 结构 ， 即 除了 存储 各 结 点 本 入 
的 数据 外 ,还 要 用 指针 表示 结 点 间 的 逻辑 关系 〈 父 子 天 系 )。 下 面 介 绍 树 的 3 种 常用 存储 方 
法 ， 每 种 方法 中 各 结 点 的 结构 相同 。 
1. 双亲 链表 表示 法 
该 方法 就 是 在 存储 结 点 信息 的 同时 ， 为 每 个 结 点 附设 一 个 指 回 其 双 杀 的 指针 parent。 
尽管 可 用 动态 链表 来 实现 这 种 表示 法 ， 然 而 用 静态 链表 更 为 方便 ， 其 类 型 定义 如 下 ; 
const int maxsize=100; // 结 点 数 的 最 大 值 ， 假 设 为 100 
typedef struct { 
datatype data; / /数据 域 
int parent; // 双 杀 域 (静态 指针 域 ) 
} pnode; 


typedef struct { 
pnode nodes [maxsize+1];  // 结 点 数组 ，0 号 单元 未 用 


int n; // 结 点 数 
} ptree; / /静态 双亲 链表 类 型 
ptree P; / /静态 双亲 链表 
各 个 结 点 在 结 点 数组 中 的 存储 顺序 原则 上 是 任意 的 ， 但 一 般 将 根 放 在 开始 位 置 〈 和 否则 


根 需 要 但 找 ), 并 且 和 弟弟 按 层 序 编号 的 顺序 存放 。 这 里 数组 下 标 从 1 开始 使 用 是 为 了 运算 上 
的 方便 : 编号 为 1〈 编 号 从 1 开始 ) 的 绪 点 就 直接 存放 到 1 工 号 单元 。 但 0 与 单元 也 可 用 来 存 
放 其 他 信息 ， 如 结 点 总 数 等 〈 这 时 ptree 类 型 中 的 数据 域 n 可 省 略 )。 

在 双亲 链表 中 ， 若 结 点 i 的 双亲 是 结 点 j， 则 nodesfi]parent=j， 若 结 点 i 是 根 结 点 ， 则 
nodes[i].parent=0。 对 图 5.26 (a) 所 示 的 树 T， 其 双 杀 链表 见 图 5.26 (b)。 
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图 5.26 树 的 双亲 链表 表示 示意 图 


显然 ， 在 这 种 存储 方式 下 ， 找 指定 结 点 的 双 杀 或 祖先 (包括 根 〉 十 分 方便 ， 只 要 沿 看 
结 点 的 双 杀 指针 搜索 即 可 。 但 各 求 指定 结 点 的 孩子 或 子孙 ， 则 可 能 要 过 有 历 整 个 数组 。 另 外 ， 
求 结 点 的 兄弟 也 不 方便 。 不 过 ， 硅 结 点 按 层 序 编写 顺序 存储 ， 则 孩子 的 下 标 大 于 双亲 的 下 
标 ， 兄 第 结 点 间 的 下 标 从 左 回 右 递增 ， 利 用 这 些 特 点 ， 可 在 过 历 搜索 中 节省 一 定 的 时 间 。 
以 求 结 点 1 的 长 子 为 例 ， 算 法 如 下 : 

int firstchild(ptree *P,int 1) { 

ri 
for (]=1I+17]<=P->ny]++) 

if (P->nodes[j] .parent==i) return j;// 第 一 个 双亲 为 P[i] 的 结 点 是 P[i] 的 长 子 
return 0; // 未 找到 

} 

2. 孩子 链表 表示 法 

树 中 各 个 结 点 的 孩子 个 数 一 般 不 同 ， 如 果 采 用 类 似 二 叉 链 表 的 方法 来 表示 结 点 及 其 防 
子 的 天 系 ， 则 每 个 结 点 设置 多 少 个 孩子 指针 域 难以 确定 。 大 以 树 的 度 k 来 设置 ， 则 mn 个 结 
点 的 树 中 ， 其 空 指 针 域 的 数目 是 kn-(n-1)=n(k-1)+1， 这 将 造成 极 大 的 空间 浪费 。 若 每 个 结 
点 按 其 实际 孩子 数 设 置 指针 ， 就 需要 在 结 点 内 设置 上 度数 域 degree 以 指出 实际 指针 数 ， 这 样 


一 来 ， 各 结 点 不 等 长 也 不 同 构 ， 且 插入 、 删 除 时 结 点 大 小 还 需 重 新 调整 ， 使 用 不 便 。 

一 种 比较 好 的 方法 是 ， 为 树 中 每 个 结 点 各 目 建 立 一 个 孩子 链表 。 每 个 孩子 链表 由 其 头 
指针 唯一 确定 ， 为 了 便于 奉 找 ， 将 所 有 头 指 针 用 一 个 数组 集中 存放 ， 并 与 存放 结 点 数据 的 
结 点 数组 合并 成 一 个 结构 数组 ， 称 为 表 头 数组 ， 即 数组 中 每 个 元 素 由 两 部 分 组 成 : 数据 域 
和 指针 域 。 其 中 ， 数 据 域 存放 结 点 的 内 容 信息 ， 指 针 域 存放 该 结 点 的 孩子 链表 的 头 指针 。 
其 类 型 定义 如 下 : 

const int maxsize=100; // 结 点 数 的 最 大 值 ， 假 设 为 100 

typedef struct cnode * pointer; // 孩 子 链表 结 点 指针 类 型 

struct cnode { / /孩子 链 结 点 结构 

int childno; / /孩子 结 点 的 序号 


pointer next; 
}; 
typedef struct { 
datatype data; 
pointer first; 


} hnode; // 表 头 结 点 类 型 
typedef struct { 
hnode nodes [maxsize+1]; // 表 头 数组 ，0 号 单元 未 用 


int n; // 结 点 数 
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} childlink; / /孩子 链表 类 型 

childlink T; / /孩子 链表 

这 里 表 头 数组 也 从 1 号 单元 开始 使 用 (0 号 单元 可 用 来 存放 其 他 信息 , 如 根 结 点 位 置 )。 
各 结 点 信息 在 表 头 数组 中 一 般 也 按 层 序 编号 的 顺序 存放 , 这 时 1 号 单元 就 是 根 结 点 ; 否则 ， 


宜 在 链表 类 型 中 增加 一 个 根 结 点 位 置 指针 ， 因 为 在 这 种 链表 中 找 根 结 点 不 方便 。 
图 5.27 (a) 就 是 图 5.26 〈a) 所 示 树 的 孩子 链表 表示 。 其 中 ， 硅 条 结 点 i 为 叶子 ， 则 
其 孩子 链表 为 定 ， 即 nodes[1].first=NULL。 对 非 叶 子 结 点 ，nodes[1].first!l=NULL， 对 应 的 孩 


子 链表 由 结 点 i 的 所 有 孩子 结 点 的 序号 构成 。 如 nodes[31.first 所 指 的 链表 有 三 个 结 点 6、7 
和 8， 表示 结 点 3 有 三 个 孩子 : 结 点 6、7 和 8。 

childno next data parent first hildno next 
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5.27 树 的 孩子 链表 表示 示意 图 


与 双 杀 链表 表示 法 相反 ， 孩 子 链表 表示 便于 实现 涉及 孩子 和 子孙 的 运算 ， 但 不 便于 实现 
与 双 杀 有 关 的 运算 。 因 此 可 将 这 两 种 表示 法 结合 起 来 , 形成 双亲 孩子 链表 表示 法 。 图 5.27 (b) 
就 是 图 5.26 (a) 所 示 树 的 双 杀 护 子 链表 表示 。 

3. 孩子 兄弟 链表 表示 法 

在 介绍 树 转 换 为 二 叉 树 时 , 实际 上 利用 和 证 明了 这 样 一 个 事实 : 树 中 结 点 之 间 的 关系 ， 
可 用 该 结 点 与 其 最 左边 的 孩子 和 右 邻 的 兄弟 之 间 的 关系 来 描述 。 因 此 ， 在 存储 各 结 点 信息 
的 同时 ， 附 加 两 个 指针 域 ， 分 别 指 问 该 结 点 最 左边 的 孩子 和 右 邻 的 兄弟 ， 就 得 到 树 的 孩子 
兄弟 链表 表示 。 这 其 实 相 当 于 存储 与 树 对 应 的 二 又 树 。 例 如 ， 图 5.26 (a) 所 示 树 的 孩子 兄 
弟 链表 如 网 5.28 所 示 。 

这 种 存储 结构 的 最 大 优点 是 ， 它 和 二 又 树 的 二 又 链 表 表 示 完 全 一 样 ， 只 是 结 点 的 两 个 
指针 的 含义 有 所 不 同 。 因 此 ， 可 利用 二 又 树 的 算法 来 实现 对 树 的 操作 。 

以 上 方法 中 逻辑 信息 是 显 式 表示 的 ， 其 中 指针 的 空间 开销 较 大 。 树 还 有 一 些 “ 压 缩 ” 
型 的 储存 方法 , 逻辑 信息 用 占 空间 很 小 的 一 些 相 关 信 息 (如 左 、 右 孩子 标志 , 结 点 度数 等 )， 
并 结合 特定 的 存放 顺序 (如 先 根 、 后 根 、 层 次 顺序 等 ) 间接 表示 ， 在 具体 使 用 时 再 由 这 些 
相关 信息 求 出 逻辑 信息 ， 即 以 时 间 换 空间 ， 相 对 比较 烦琐 ， 这 里 从 略 。 
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5.28 树 的 孩子 兄弟 链表 表示 示意 图 


5.7.3” 树 和 和 森林 的 遍历 


在 树 和 森林 中 , 每 个 结 点 可 有 两 棵 以 上 的 子 树 , 并且 各 结 点 子 树 的 个 数 也 不 一 定 相 同 ， 
因此 不 便 讨 论 它们 中 根 次 序 的 志 历 , 但 可 研究 先 根 和 后 根 次 序 的 遍历 。 设 树 TT 如 图 5.29 所 
示 ， 结 点 及 为 根 ， 根 的 子 树 从 左 到 右 依 次 为 Ti、T、…、TIx*。 树 的 两 种 遍历 方法 定义 为 : 

(1) 前 序 过 历 树 工 

右 树 工 非 衬 ， 则 : (R) 

Q 访问 根 结 点 R。 

@ 依次 前 序 遍 历 根 RR 的 各 子 树 Ti、T2z、…、Tx。 册 

(2) 后 序 壳 历 树 工 A\ /A A 

右 树 工 非 空 ， 则 : 图 5.29 树 T 

Q 依次 后 序 遍 历 根 RR 的 各 子 树 TI、T2、…、Tx。 

@ 访问 根 结 点 R。 

例如 ， 对 图 5.30 (a) 所 示 的 树 进行 前 序 遍 历 和 后 序 裔 历 ， 得 到 的 前 序 序列 和 后 序 序列 
分 别 是 ABECD 和 EBCDA。 

值得 注意 的 是 : 前 序 壳 历 一 棵 树 恰好 等 价 于 前 序 遍 历 该 树 对 应 的 二 又 树 ， 后 序 遍 历 一 
棵 树 恰好 等 价 于 中 序 遍 历 该 树 对 应 的 二 又 树 。 这 可 由 树 与 二 又 树 的 转换 关系 以 及 树 与 二 又 
树 遍 历 的 定义 推 得 。 例 如 在 图 5.30 中 ， 子 图 (b) 是 子 图 (a) 对 应 的 二 叉 树 ， 它 的 前 序 序 
列 和 中 序 序列 正 是 ABECD 和 EBCDA.。 


(A) (A) 
(B) 
(3 (D) 
(a) 树 (b) 对 应 的 二 叉 树 


5.30” 树 和 对 应 的 二 又 树 


类 似 地 ， 可 得 到 森林 的 两 种 遍历 方法 : 
(1) 前 序 遍历 森林 

车 森 林 非 空 ， 则 : 

@ 访问 森林 中 第 一 棵 树 的 根 结 点 。 
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@ 前 序 壳 历 第 一 棵 树 中 根 结 点 的 各 子 树 所 构成 的 森林 。 

G@) 前 序 壳 历 除 第 一 棵 树 外 其 他 树 构 成 的 森林 。 

(2) 后 序 遍 历 森 林 ? 

知 森 林 非 空 ， 则 : 

GO 后 序 壳 历 和 森林 中 第 一 棵 树 的 根 结 点 的 各 子 树 所 构成 的 森林 。 

@) 访问 第 一 棵 树 的 根 结 点 。 

G@) 后 序 壳 历 除 第 一 棵 树 外 其 他 树 构 成 的 森林 。 

简 言 之 ， 前 序 遍 历 森 林 就 是 从 左 到 右 依 次 前 序 遍 历 森 林 中 的 每 一 棵 树 ， 后 序 遍 历 森 林 
就 是 从 左 到 右 依 次 后 序 壳 历 森 林 中 的 每 一 棵 树 。 

和 遍历 树 类 似 ， 前 序 遍 历 森 林 等 价 于 前 序 志 历 该 森林 对 应 的 二 又 树 ， 后 序 遍 历 森 林 等 
价 于 中 序 遍 历 该 森林 对 应 的 二 叉 树 。 这 同样 可 由 森林 与 二 又 树 的 转换 关系 以 及 森林 与 二 又 
树 遍 历 的 定义 推 得 。 例 如 ， 对 图 5.31 (a) 所 示 的 森林 进行 前 序 饥 历 和 后 序 遍 历 ， 得 到 该 森 
林 的 前 序 序列 和 后 序 序列 分 别 为 ABECDFGH 和 EBCDAGHF。 图 5.31 (b) 是 该 森林 对 应 
的 二 叉 树 ， 它 的 前 序 序列 和 中 序 序列 也 分 别 为 ABECDFGH 和 EBCDAGHF。 


(A 


(B) (©) 
(E) 


(a) 森林 (b) 对 应 的 二 又 树 
图 5.31 和 森林 和 对 应 的 二 又 树 


由 上 述 讨论 可 知 ， 当 用 二 又 链 表 作 为 树 和 和 森林 的 存储 结构 时 ， 树 和 森林 的 前 序 过 历 和 
后 序 裔 历 ， 可 用 二 叉 树 的 前 序 遍 历 和 中 序 遍 历 算法 来 实现 。 男 外 ， 对 树 和 森林 也 可 以 进行 
层 序 裔 历 。 

(1) 层 序 过 历 树 工 

右 树 工 非 空 ， 则 : 

Q 访问 根 结 点 及 。 

@) 车 第 1 (Ci=1) 层 结 点 已 访问 ， 则 访问 第 il1 层 结 点 时 ， 按 从 左 到 右 的 次 序 依次 访 
问 第 i+1 层 上 的 结 点 。 

显然 ， 对 树 按 层 序 壳 历 得 到 的 过 有 历 序列 与 结 点 的 层 序 编号 一 致 。 事 实 上 ， 对 结 点 进行 
层 序 编号 的 过 程 本 身 就 是 一 种 层 序 壳 历 〈 访 问 结 点 的 操作 就 是 给 它 编 个 号 )。 

(2) 层 序 壳 历 和 森林 

这 就 是 将 森林 中 各 树 的 同 层 结 点 依次 输出 。 例 如 ， 图 5.31 (a) 所 示 森 林 的 层 序 遍 历 序 
列 为 AFBCDGHE。 

注意 ， 层 序 壳 历 和 森林 不 是 依次 对 和 森林 中 的 每 一 棵 树 进 行 层 序 过 历 ， 而 是 所 有 树 按 同 层 
结 点 依次 输出 。 这 不 难 理解 : 设想 有 一 个 虚 的 (总 ) 根 结 点 ， 使 森林 中 的 各 树 作为 其 子 树 ， 


(D 有 的 文献 称 此 为 森林 的 中 序 遍 历 ， 即 按 第 一 棵 树 的 根 (D)、 第 一 棵 树 的 子 树 森 林 (A)、 第 一 棵 树 
外 其 他 树 构 成 的 森林 (B)〉 三 者 访问 的 先后 顺序 来 定义 森林 的 遍历 : 先 根 DAB、 中 根 ADB、 后 根 ABD。 


则 森林 的 层 序 电 历 就 是 该 树 的 层 序 志 历 ， 也 即 各 子 树 按 同 层 结 点 依次 输出 。 

易 见 ， 层 序 志 历 树 或 木林， 等 价 于 沿 右 指 针 方 同 “ 层 序 ” 人 过 历 对 应 的 二 又 树 。 这 里 ， 
在 对 应 二 又 树 中 ， 结 点 与 其 右 孩 子 ， 右 孩子 的 右 孩 子 ，……… ， 为 同 层 结 点 ， 而 左 指针 起 到 
承 上 局 下 的 作用 。 据 此 不 难 写 出 具体 的 层 序 过 有 历 算 法 《〈 略 ， 见 习题 5.21)。 


68 哈 夫 曼 树 及 其 应 用 


树 的 应 用 非常 之 广 ， 本 节 以 哈 夫 曼 (Huffman) 树 为 例 介绍 树 的 应 用 。 
5.8.1 最 优 二 又 树 ( 哈 夫 曼 树 ) 


在 许多 应 用 中 ， 利 第 将 树 中 结 点 赋予 一 个 有 茶 种 意义 的 实数 ， 称 为 该 结 点 的 权 。 结 点 
到 树 根 之 间 的 路 径 长 度 与 该 结 点 权 的 乘积 称 为 该 结 点 的 市 权 路 径 长 度 。 树 的 (外 部 ) 带 权 
路 径 长 度 〈Weighted Path Length)， 定 义 为 树 中 所 有 叶子 结 点 的 珊 权 路 径 长 度 之 和 ， 通 第 
记 为 : 

WPL= SY wl, 

其 中 ，n 表示 叶子 结 点 的 数目 ，wi 和 分别 表 示 叶 结 点 1 的 权 值 和 它 到 根 之 间 的 路 径 
长 度 。 在 权 为 Wi、w2、*…、ws 的 nn 个 叶 结 点 的 所 有 二 又 树 中 ， 和 带 权 路 径 长 度 WPL 最 小 的 
二 又 树 称 为 最 优 二 又 树 或 哈 夫 曼 树 。 

在 给 定 了 叶子 及 其 权 后 ， 如 何 构造 最 优 二 又 树 呢 ? 先 看 一 个 例子 。 

给 定 4 个 叶子 结 点 a、b、c 和 d， 权 分 别 为 6、3、4 和 8。 我 们 可 以 构造 如 图 5.32 所 
示 的 3 棵 二 叉 树 〈 还 有 多 个 )。 它 们 的 带 权 路 径 长 度 分 别 为 : 


(a) (b) (c) 
图 5.32 ”叶子 相同 的 三 棵 二 叉 树 


(a) WPL=6x2+3x2+4x2+8x2=42 

(b) WPL=6x3+8x3+4x2+3x1=53 

(c) WPL=3x3+4x3+6x2+8x1=41 

其 中 树 (a) 为 完全 二 又 树 ， 但 它 的 WPL 并 不 是 最 小 ; 最 小 的 是 树 (c)， 下 面 将 看 到 ， 
它 就 是 哈 夫 曼 树 。 树 〈c) 有 个 特点 : 权 越 大 的 叶子 离 根 越 近 。 这 可 从 WPL 的 表达 式 来 理 
解 : 如 果 权 wi 较 大 ， 则 希望 路 径 1 较 小 ， 这 样 wili 就 会 较 小 ， 从 而 有 利于 减 小 WPL。 不 过 
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这 种 分 析 是 不 严格 的 ， 因 为 WPL 考虑 的 是 总 体 情况 ， 而 不 是 个 别 叶子 帝 权 路 径 的 变 长 或 
变 短 ， 但 一 般 情况 下 这 个 特点 还 是 存在 的 。 在 此 基础 上 ，1952 年 哈 夫 曼 给 出 了 一 个 求 最 优 
二 义 树 的 精巧 方法 ， 称 之 为 哈 夫 曼 算法 ， 步 又 如 下 : 

(1) 首 先 ,根据 给 定 的 n 个 权 值 wwz、…、wa 构 造 含 有 mn 柠 二 又 树 的 和 森林 E={Tu T2,… 
Taj， 其 中 每 柠 二 又 树 Ti 中 只 有 一 个 权 值 为 wi 的 根 结 点 ， 没 有 左右 子 树 。 

(2) 在 森林 FF 中选 出 两 柠 根 结 点 权 值 最 小 的 树 ( 当 这 样 的 树 不 止 丙 柠 时 ， 可 从 中 任 选 
两 棵 ), 将 这 两 棵 树 合并 成 一 棵 新 的 二 又 树 。 这 时 会 增加 一 个 新 的 根 结 点 , 它 的 权 取 为 原来 
两 棵 树 的 根 的 权 值 之 和 ， 而 原来 的 两 棵 树 就 作为 它 的 左右 子 树 ( 谁 左 、 谁 右 无 关 紧 要 )。 

(3) 对 新 的 森林 下 乍 复 步 骤 (2)， 和 耻 到 条 林 F 中 只 剩 下 一 标 树 为 止 。 这 标 树 便 是 哈 夫 
曼 树 。 
按照 这 个 算法 ， 权 越 大 的 叶子 合并 的 时 机 越 晚 ， 它 离 最 终 的 根 也 束 越 近 ， 正 好 符合 
面 的 定性 分 析 和 观察 结果 。 

由 哈 夫 曼 算法 可 知 ， 哈 夫 曼 树 不 一 定 唯 一 (但 WPL 是 相同 的 ， 并 且 都 为 最 小 )。 原 因 
在 于 每 次 合并 时 ， 原 两 柠 树 谁 左 谁 右 ， 以 及 候选 的 两 棵 树 有 多 个 时 选 哪 两 个 等 。 图 5.33 表 
示 了 用 该 算法 从 上 述 4 个 叶子 构造 哈 夫 曼 树 的 过 程 ， 其 中 在 合并 时 将 根 权 值 小 的 二 又 树 作 
为 新 根 的 左 子 树 ， 其 结果 (d) 就 是 图 5.32 中 的 树 (c)。 


7 
6 3 4 8 6 3 4 8 
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(a) 初始 森林 (b) b 与 c 合 并 (c) a 合并 (d) d 合并 

图 5.33 ”了 哈 夫 曼 树 的 构造 过 程 


在 哈 夫 曼 算 法 中 ， 初 始 森林 共有 mn 棵 二 叉 树 ， 每 棵 树 中 仅 有 一 个 结 点 ， 它 们 既是 根 ， 
又 是 叶子 。 算 法 的 第 二 步 是 将 当前 和 森林 中 的 两 棵 根 结 点 权 值 最 小 的 二 叉 树 合并 成 一 棵 新 二 
又 树 。 每 合并 一 次 ， 和 森林 中 就 减少 一 棵 树 。 显 然 ， 要 进行 n-1 次 合并 ， 才 能 使 森林 中 二 又 
树 由 n 标 减 少 到 只 剩 一 柠 ， 即 最 终 的 哈 夫 曼 树 。 另 外 ， 每 合并 一 次 都 要 产生 一 个 新 结 点 ， 
合并 n-1 次 共产 生 n-1 个 新 结 点 。 由 此 可 知 ， 最 终 求 得 的 哈 夫 曼 树 中 共有 n+(n-1)=2n-1 
个 结 点 ， 其 中 的 叶 结 点 就 是 初始 森林 中 的 nn 个 孤立 结 点 。 

在 哈 夫 曼 树 中 ， 每 个 分 文 结 点 都 是 合并 过 程 中 产生 的 ， 它 们 的 上 度 为 2， 所 以 树 中 没有 
度 为 1 的 分 支 结 点 ,这 类 树 通常 称 为 严格 二 叉 树 "(Strictly Binary Tree ) 或 正则 二 叉 树 (Proper 
Binary Tree)。 实 际 上 所 有 具有 mn 个 叶 结 点 的 严格 二 又 树 都 恰好 有 2n-1 个 结 点 。 

我 们 用 一 个 大 小 为 2n-1 的 数组 来 存储 哈 夫 受 树 中 的 结 点 ， 其 存储 结构 为 : 

const int n=20; // 叶 子 结 点 数 ， 假 设 为 20 


Q) 有 的 文献 称 此 为 满 二 又 树 (Full Binary Tree); 有 的 文献 称 此 为 完全 二 叉 树 (Complete Binary Tree); 
也 有 其 他 称呼 ， 如 2-tree、 强 二 又 树 等 。 


Const int m=2*n—1; // 结 点 总 数 
typedef struct { 
float weight; 
int parent,1lchild,rchild; 
} nodetype; // 结 点 类 型 
typedef nodetype hftree [m] ;// 哈 夫 曼 树 类 型 ， 数 组 从 0 号 单元 开始 使 用 
hftree T; // 哈 夫 曼 树 问 量 


其 中 ， 每 个 结 点 包括 4 个 域 ，weight 是 结 点 的 权 值 ，lchild、rchild 分 别 为 结 点 的 左 、 


右 孩 子 在 数组 中 的 下 标 ， 叶 结 点 的 这 两 个 指针 值 为 -1; parent 是 结 点 的 双亲 在 数组 中 的 下 
标 。 这 里 设置 parent 域 不 仅 可 使 以 后 涉及 双亲 的 运算 方便 ， 还 可 在 合并 时 区 分 根 结 点 和 非 
根 结 点 : 大 parent 的 值 为 -1， 则 该 结 点 无 双亲 ， 即 为 根 结 点 ， 尚 未 合并 过 。 之 所 以 要 区 分 
根 结 点 与 非 根 结 点 ， 是 因为 每 次 合并 两 棵 二 又 树 时 ， 要 先 在 当前 森林 的 所 有 结 点 中 找 两 个 
权 值 最 小 的 根 结 点 ， 因 此 ， 有 必要 为 每 个 结 点 设置 一 个 标记 以 区 分 根 结 点 和 非 根 结 点 。 


在 上 述 存储 结构 上 实现 的 哈 夫 曼 算法 可 粗略 地 描述 为 : 

(1) 初始 化 : 将 初始 森林 的 各 根 结 点 〈 叶 子 ) 的 双 杀 和 左 、 右 孩子 指针 置 为 -1。 

(2) 输入 叶子 权 : 叶子 在 结 点 癌 量 T 了 的 前 n 个 分 量 中 ， 构 成 初始 森林 的 n 个 根 结 点 。 
(3) 合并 : 对 森林 中 的 树 进行 n-1 次 合并 ， 共 产生 n-1 个 新 结 点 ， 依 次 放 入 结 点 问 量 


TI 的 第 i 个 分 量 中 (n<i<m-1)。 每 次 合并 的 步骤 是 : 


Q 在 当前 森林 的 所 有 结 点 TD] (0<j<i-1〉 中 ， 选 取 具 有 最 小 权 值 和 次 小 权 值 的 两 个 


根 结 点 ， 分 别 用 pl 和 p2 记 住 这 两 个 根 结 点 在 结 点 癌 量 TT 中 的 下 标 。 


色 将 根 为 Tfpl] 和 T[p2] 的 两 柠 树 合并 , 使 其 成 为 新 结 点 工 ] 的 左右 孩子 ,得 到 一 柠 以 


新 结 点 TH 为 根 的 二 又 树 。 同 时 修改 Tpl1] 和 TIp2] 的 双亲 域 ， 使 其 指向 新 结 点 TH]， 这 意 
味 着 它们 在 当前 森林 中 已 不 再 是 根 。T[Ip1] 和 TIp2] 的 权 值 相 加 后 ， 作 为 新 结 点 T 和 的 权 值 。 


求 精 后 的 哈 夫 曼 算 法 如 下 : 


Vold huffman (hftree T) { 
int 1 J]rplrp2s 
float smalll, small2; 
for(i=0;i<n;i++) { / /初始 化 
T[i] .parent=-—1; 
T[i] .lchild=T[1i] .rchild=—1; 
} 


for (1=0; i1<n; 1++) // 输 入 mn 个 叶子 的 权 
cin>>T[1i] .weight; 
for (i=n;i<m;i++) { // 进 行 n-1 次 合并 ， 产 生 n-1 个 新 结 点 
pl=p2=-1; // 此 人 句 可 不 要 
smalll=small2=FLOAT MAX; //FLOAT MAX 为 float 类 型 的 最 大 值 
for (j=0;j<=i-—1;j++) { // 找 两 个 权 值 最 小 的 根 结 点 
if(T[j] .parent!=-1) continue; // 不 考虑 已 合并 过 的 结 点 
if (T[j] .weight<smalll) { / /修改 最 小 权 、 次 小 权 及 其 位 置 


small2=smalll; 
smalll=T[]j]] .weight; 
p2=pl1; 
pl=]; 
} 
else if(T[j] .weight<small12) { // 修 改 次 小 权 及 位 置 
small2=T[]j] .weight; 
p2=]; 
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} 
} 
T[pl1] .parent=T[p2] .parent=1; 
T[i] .parent=—1; // 新 根 
T[i] .lchild=pl; 
T[1i] .rchild=p2; 
T[1i] .weight=smalll+small2; 
} 
} 


注意 ， 哈 夫 曼 树 虽然 不 一 定 唯一 ， 但 算法 huffman 得 到 的 结果 是 唯一 的 ， 因 为 按 该 算 
法 执行 时 ， 如 果 中 途 有 两 个 以 上 的 根 权 都 最 小 ， 则 它 选 中 的 是 数组 下 标 较 小 的 两 个 ;并 且 
在 合并 时 ， 权 最 小 的 根 作 左 子 树 ， 权 次 小 的 根 作 右 子 树 ， 故 不 会 出 现 不 确定 的 情况 。 

以 前 面 4 个 权 为 6、3、4、8 的 叶子 为 例 ， 用 上 述 拭 法 求 哈 夫 曼 树 的 过 程 狗 图 5.34。 
注意 ， 图 中 只 男 出 了 weight 域 的 变化 情况 。 因 为 n=4， 故 进行 3 次 合并 。 合 并 过 的 结 点 用 
阴影 表示 ， 以 后 不 再 考虑 ; 当前 权 值 最 小 的 两 个 根 结 点 用 下 划 线 表示 。 


0 1 2 3 4 5 6 
初始 森林 
第 一 次 合并 | 6 8 了 7 | 
第 二 次 合并 
第 = 次 台 并 甘于 3| > | 


图 5.34 ” 哈 夫 曼 算法 的 执行 过 程 
5.8.2 ”了 蛤 夫 曼 编码 与 压缩 


哈 夫 曼 树 的 应 用 很 多 ， 本 节 介 绍 哈 夫 受 编码 与 压缩 。 

我 们 在 使 用 计算 机 的 时 候 ， 为 了 减少 数据 文件 所 占用 的 磁盘 空间 ， 或 者 为 了 提高 网 络 
数据 传递 的 时 间 效 率 ， 经 常 对 文件 进行 压缩 以 减少 文件 的 大 小 ， 如 常见 的 压缩 格式 有 ZIP、 
LHA、RAR 等 。 其 实 ， 利 用 哈 夫 曼 算 法 ， 也 能 进行 简单 的 文件 压缩 。 

假设 文件 中 有 nm 个 字符 ， 则 该 文件 大 小 就 是 n 字 节 (byte)， 或 8n 位 (bit)， 这 是 因为 
每 个 字符 的 ASCII 编码 为 8 位 ， 最 多 可 以 表示 2 =256 种 字符 。 若 实际 使 用 的 字符 种 类 较 
少 ， 则 可 不 必用 8 位 编码 ， 比 如 只 有 30 种 时 只 需 $ 位 编码 就 可 以 了 2”=32>30)， 这 样 可 
一 定 程 度 地 节省 文件 长 度 。 一 般 对 种 字符 编码 需要 [logjk| 位 。 以 上 各 种 字符 的 编码 长 度 
都 相等 ， 称 为 等 长 码 。 但 是 ， 文 件 中 各 个 字符 使 用 的 频率 是 不 等 的 ， 如 英文 中 正和 TI 的 使 
用 一 般 就 比 Q、X、Z 等 频繁 几 十 倍 。 大 采 用 不 等 长 编码 ， 让 使 用 频率 高 的 字符 的 编码 缩 
短 ， 就 可 使 文件 总 长 变 短 。 注 意 ， 不 等 长 编码 后 文件 应 以 二 进 制 形式 存放 。 

然而 ， 采 用 不 等 长 编码 时 有 可 能 产生 多 义 性 。 例 如 ， 假 设 00 表示 E，01 表示 T，0001 
表示 W， 则 当 取 出 的 编码 信息 串 是 0001 时 ， 就 无 法 确定 原文 是 ET 还 是 W。 产 生 该 问题 
的 原因 是 E 的 编码 与 W 的 编码 的 开始 部 分 (前 级 ) 相同 。 因 此 ， 不 等 长 编码 中 要 求 任 一 
字符 的 编码 都 不 是 其 他 字符 编码 的 前 级 ， 这 种 编码 叫做 前 组 ( 编 ) 码 。 显 然 , 等 长 的 ASCII 
公 是 前 级 公 。 

假设 组 成 文件 的 字符 集 是 D={di, d;,…, dn}， 每 个 字符 di 在 文件 中 出 现 的 次 数 是 ci， 


对 应 的 编码 长 度 是 1， 则 文件 总 长 为 8\cl 。 因 此 ， 使 文件 总 长 最 小 就 是 使 cl 取 最 小 


值 。 然 而 ， 我 们 不 可 能 对 每 个 文件 都 去 统计 其 中 每 个 字符 具体 的 出 现 次 数 se， 但 通过 对 大 
量 文件 的 统计 分 析 ， 可 以 得 到 每 个 字符 出 现 的 概率 p， 则 》 pil 表示 平均 码 长 。 显 然 ， 平 
均码 长 越 小 ， 文 件 的 平均 总 长 就 越 短 。 例 如 ， 设 字符 集 D 及 其 概率 分 布 P 为 : 

D={a, b, ©, de 

P={0.12, 0.40, 0.15, 0.08, 0.25} 

在 该 字符 集 D 上 的 三 种 不 同 的 前 级 编码 如 图 5.35 所 示 ， 其 中 编码 1、 编 码 2 和 编码 3 
的 平均 码 长 分 别 为 3、2.2 和 2.15。 可 以 证 明 编码 3 就 是 上 述 给 定 概率 分 布下 的 最 优 前 缀 码 
( 即 平均 码 长 pl， 最 小 的 前 绥 码 )。 


1=1 


字符 编码 2 | 编码 3 


5.35 三 种 前 组 码 
观察 表达 式 六 pl ， 如 果 我 们 取 pi 为 叶 结 点 的 权 , 取 编码 长 度 为 叶 结 点 的 路 径 长 度 ， 


则 平均 码 长 总 p1 最 小 的 问题 就 是 一 个 带 权 路 径 长 度 最 小 的 哈 夫 曼 树 的 构造 问题 。 于 是 可 
以 这 样 求 最 优 前 组 码 。 用 由 、 由 、…、 凤 作为 叶 结 点 ， 用 pi、Pz、…、Pa 作 叶 结 点 的 权 ， 
构造 一 棵 哈 夫 曼 树 ; 然后 将 哈 夫 盟 树 中 每 个 分 支 结 点 的 左 分 支 标 0， 右 分 支 标 1， 把 从 根 到 
每 个 叶子 的 路 径 上 的 标号 连接 起 来 ， 作 为 该 叶子 所 代表 的 字符 的 编码 。 注 意 ， 每 个 字符 
的 编码 长 度 对 应 叶子 的 路 径 长 度 1。 在 哈 夫 曼 树 中 ， 没 有 任何 叶子 是 其 他 叶子 的 祖先 ， 记 
以 每 个 叶 结 点 对 应 的 编码 不 可 能 是 其 他 叶 结 点 编码 的 前 级 ， 即 上 述 编码 得 到 的 是 前 级 码 。 
这 个 过 程 就 是 哈 夫 曼 编码 。 据 此 编码 就 可 对 文件 进行 压缩 ， 这 个 过 程 就 不 细 述 了 。 

例如 ， 对 图 5.35 给 出 的 字符 集 及 其 概率 分 布 ， 用 哈 夫 曼 算法 构造 的 哈 夫 盟 编码 树 及 其 
对 应 的 哈 夫 曼 编 码 如 图 5.36 所 未。 

在 哈 夫 最 树 的 存储 结构 中 ， 每 个 结 点 都 存 有 其 双亲 指针 ， 所 以 在 求 哈 夫 曼 编码 的 过 程 
中 ， 可 以 从 时 结 点 出 发 ， 向 上 回潮 直到 根 结 点。 具体 过 程 是 ， 从 叶子 TI 出发， 利用 双亲 
指针 找到 其 双亲 TIp]， 再 根据 TIp] 的 孩子 指针 可 以 知道 T[] 是 TIp] 的 左 孩 子 还 是 右 孩 子 ， 
若是 左 孩子 ， 则 生成 代码 0， 否 则 生成 代码 1， 然 后 以 TIp] 为 出 发 点 ， 继 续 上 述 过 程 ， 直 
到 根 结 点 。 

显然 ， 这 里 生成 的 代码 序列 与 所 求 编码 次 序 相反 ， 因 此 ， 可 以 将 生成 的 代码 按 从 后 往 
前 的 次 序 依次 存放 在 一 个 位 串 bits 中 。 虽 然 各 字符 的 编码 长 度 不 同 ， 但 最 大 不 会 超过 m， 
所 以 ，bits 的 大 小 可 设 为 n， 然 后 用 一 个 整 型 变量 start 来 指示 编码 在 位 串 bits 中 的 起 始 位 
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置 ， 其 类 型 定义 和 编码 算法 如 下 : 


typedef struct { 


char bits [n]:; // 位 串 ， 存 放 纺 人 码 

char ch; // 字 符 

int start; / /编码 在 位 串 中 的 起 始 位 置 
} nodetype; / /编码 结 点 类 型 


typedef nodetype codelist[n]; // 编 人 码 表 类 型 


Vold encode (codelist codes,hftree T) { 
nt 10 .Datarts 


for(i=0;i<n;1i++) { // 从 叶 结 点 出 发 加 上 回潮 

cin>>codes [i] .ch; // 读 入 叶子 字符 

start=n; 

C=1; 

p=T [i] .parent; // 取 出 双亲 

while(p!=-—1) { 
start——s 
if (T[p] .lchild==c) codes [i] .bits[start]=’0’;// 左 子 树 编 0" 
else codes[i] .bits[start]=’1’;// 右 子 树 编 1" 
c=p; 


p=T[p] .parent; 
} 


codes[1] .start=start; 
} 
} 


以 图 5.36 (a) 所 示 的 哈 夫 曼 树 为 例 ， 上 述 算法 求 出 的 哈 夫 曼 编 码 见 图 5.37。 


a:1111 
b:0 
c:110 
汪汪 可 
e:10 


(a) 哈 夫 曼 编 码 树 (b) 哈 夫 曼 编 码 
图 5.36 ”了 哈 夫 曼 编码 树 及 其 编码 图 5.37 哈 夫 曼 编 码 的 存储 结构 


哈 夫 曼 树 也 可 用 来 译 码 和 解压 缩 。 与 编码 过 程 相 反 ， 译 码 过 程 是 从 哈 夫 曼 树 的 根 结 点 
出 发 ， 逐 位 读 入 编码 信息 ， 若 为 0， 则 走向 左 孩 子 ， 和 否则 走向 右 孩 子 ， 一 旦 到 达 叶 结 点 工 [ 
便 译 出 相应 的 字符 codes[il.ch。 然 后 ， 重 新 从 根 结 点 出 发 继续 译 公 ， 直 到 编码 讨 缩 文件 结 
束 。 为 简单 起 见 ， 这 里 假设 编码 信息 以 十 进 制 数字 形式 逐 位 输入 ， 则 译 码 算法 如 下 : 


Vold decode (codelist codes,hftree T) { 
int i1,b,endflag; 


endflag=-1; / /编码 结束 标志 ， 假 设 取 -1 
i=m-—1; // 从 根 结 点 开始 搜索 


while (cin>>b,b!=endflag) { // 恋 入 一 个 编码 位 ， 若 不 是 结束 标志 则 循环 
if (b==0) i=T[i] .lchild; / /根据 编码 位 走 问 左 孩 子 或 右 孩 子 
else 1=T[1] .rchild; 
if (T[i] .lchild==-1) { 111 为 时 二 


cout<<codes [1] .ch; // 译 人 码 ， 输 出 字符 
1=m13 // 回 到 根 结 点 开始 下 一 次 搜索 
} 
} 
if (i!=m-1) cout<<“ 编 码 有 错 ! \n”; ”// 编 码 读 完 ， 但 结束 点 不 是 根 ， 出 错 
} 
由 于 哈 夫 曼 树 中 没有 度 为 1 的 结 点 ， 故 上 面 算法 中 仅 用 TI lchild- -1 来 判定 了 四 是 否 
为 叶 结 点 。 另 外 ， 正 确 的 结束 点 是 译 完 最 后 一 个 字符 后 输入 -1， 此 时 搜索 点 为 根 结 点 
(CI=m-] )。 
需要 指出 ， 哈 夫 曼 编码 /解码 的 主要 意义 在 于 最 优 编码 ， 用 于 文件 压缩 则 意义 不 大 ， 
为 有 更 高 压缩 率 的 方法 (如 ZIP、RAR 等 ， 它 们 压缩 原理 不 同 )。 


5.8.3 ”分 类 与 判定 树 


本 节 介 绍 哈 夫 曼 树 的 另 一 个 应 用 : 描述 快速 分 类 过 程 。 

分 类 是 一 种 常用 运算 , 其 作用 是 将 输入 的 数据 按 预 定 的 标准 划分 成 不 同 的 种 类 。 例如 ， 
一 般 来 说 ， 工 厂 生 产 的 产品 ， 质 量 有 高 有 低 ， 需 要 根据 一 定 的 质量 指标 对 产品 进行 检测 ， 
根据 检测 的 结果 将 产品 划分 成 不 同 的 等 级 ， 这 就 是 一 个 分 类 问题 。 分 类 问题 有 时 也 称 判定 
问题 ， 其 中 的 每 次 检测 也 称 一 次 判断 。 

在 分 类 过 程 中 ， 对 每 一 次 判断 ， 产 生 两 个 结果 : 要 么 成 立 ( 真 )， 要 么 不 成 立 ( 假 )， 
正好 可 用 二 又 树 的 两 个 分 文 来 表示 。 每 次 判断 后 产生 两 个 子 类 ， 如 果 某 个 子 类 不 是 所 要 的 
最 终结 果 ， 再 对 子 类 继续 进行 判断 ， 以 划分 出 更 细 的 子 类 ， 直 到 每 个 子 类 都 对 应 唯一 的 一 
种 分 类 结果 。 于 是 整个 分 类 过 程 可 以 用 一 棵 二 又 树 来 描述 ， 称 之 为 分 类 问题 的 判定 树 。 在 
判定 树 中 ， 每 个 分 文 结 点 对 应 一 次 判断 ， 每 个 叶子 结 点 对 应 一 种 分 类 结 末 ; 根 对 应 整个 分 
类 过 程 的 第 一 次 判断 。 

例如 ， 假 设 某 产品 的 等 级 标准 见 图 5.38。 图 5.39 (a) 一 图 5.39 〈c) 就 是 该 质量 检测 
问题 的 三 棵 判定 树 ， 树 上 的 4 个 分 支 结 点 对 应 于 4 次 条 件 判断 ， 树 上 的 5 个 叶子 结 点 对 应 
于 分 类 的 5 种 不 同 的 结果 ， 即 区 分 出 的 5 个 质量 等 级 。 


sn | elo [colela 
ET 5 
a | 0%5 | 02 | 035 | 02 | 0 


图 5.38 质量 等 级 标准 


由 于 判定 树 描述 的 束 是 分 类 方法 ， 因 而 由 判定 树 很 容易 号 出 相应 的 分 类 算法 。 以 
图 5.39(a) 的 判定 树 1 为 例 ， 分 类 算法 如 下 : 


char Classlfy(float X) { 
if aes Teturn “E> 
else if (x<6) return ‘DD’; 
else if (x<7) return ‘CC’; 
Slse 1f (X98) Teturn "B's 
else return ‘A’; 
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(a) 判定 树 1 (b) 判定 树 2 (c) 判定 树 3 


5.39 判定 树 示例 


显然 ， 在 分 类 中 ， 不 同等 级 的 产品 所 经 过 的 条 件 判断 次 数 一 般 是 不 同 的 ， 如 按 上 述 算 
法 ，E 类 产品 1 次 判断 就 可 确定 ，D 类 产品 要 判断 2 次 等 。 另 外 ， 如 果 判定 树 不 同 ， 即 使 
是 同一 类 产品 ， 分 类 时 所 经 过 的 判断 次 数 一 般 也 不 相同 。 例 如 ， 图 5 39 中 的 三 棵 判定 树 ， 
除 D 类 产品 都 需 2 次 判断 外 ， 其 他 各 类 产品 所 需 的 判断 次 数 就 不 完全 相同 了 。 

如 果 只 对 个 别 或 少数 产品 进行 分 类 ， 则 采用 该 问题 的 任何 一 个 判定 树 都 可 以 。 但 实际 
中 经 常 需要 对 大 量 的 产品 进行 分 类 ， 如 一 个 工厂 一 个 月 的 某 零 件 产品 就 可 能 成 千 上 万 ， 这 
时 就 要 考虑 算法 的 时 间 性 能 了 。 在 分 类 中 ， 主 要 的 操作 是 条 件 判断 ， 故 以 条 件 判断 的 次 数 
为 标准 来 分 析 算 法 的 时 间 复杂 度 。 

仍 以 上 述 产品 质量 分 级 问题 为 例 。 假 设 要 分 类 的 产品 有 件 ， 其 中 每 类 产品 所 占 的 比 
率 已 预测 出 来 ， 见 图 5.38 的 第 三 行 。 设 产品 需要 分 成 mn 类， 每 类 所 占 的 比率 为 p〔 该 类 产 
品 件数 为 Np ) ， 对 该 类 产品 分 类 所 需要 的 判断 次 数 为 e 次 ， 则 总 的 判断 次 数 为 ， 

SUM = Npic; = ND po, 


如 果 使 上 式 达 到 最 小 值 ， 则 分 类 算法 的 时 间 性 能 最 好 。 从 上 式 看 到 ， 如 果 将 产品 所 占 
的 比率 pi 看 成 是 na 个 叶子 的 权 ， 产 品 的 判断 次 数 ci 看 成 叶子 的 路 径 长 度 ， 则 这 个 问题 就 是 
最 优 二 又 树 的 构造 问题 。 于 是 可 利用 哈 夫 曼 算 法 构造 哈 夫 曼 树 ， 从 而 得 到 最 佳 判 定 过 程 。 
具体 方法 是 ， 以 每 个 类 别 的 概率 为 权 构 造 哈 夫 曼 树 ;， 在 每 次 合并 产生 的 新 结 点 上 加 上 适当 
的 判定 条 件 。 图 5.39 (b) 就 是 这 样 的 一 棵 判定 树 。 

然而 ,图 5.39 (b) 虽然 “判断 次 数 ” 最 少 ， 但 实际 执行 效果 并 不 好 。 因 为 它 的 每 次 
判断 有 些 不 是 最 基本 的 ， 如 条 件 6<a<7， 它 实际 包含 2 次 基本 比较 : xc=6 && a<7， 故 总 
的 “基本 比较 次 数 ” 不 一 定 是 最 小 的 。 

为 此 ， 需 要 对 哈 夫 曼 算法 略 作 修 改 ， 使 得 树 中 的 分 文 结 点 ， 即 每 次 判断 为 一 次 基本 比 
较 。 注 意 到 对 检测 参数 做 基本 比较 时 ， 以 检测 值 为 界 ， 所 划分 出 的 两 个 区 间 〈 子 类 ) 在 该 
参数 空间 上 是 “ 相 邻 ”的 《一 分 为 二 ， 两 者 紧邻 ， 如 区 间 a<7 和 区 间 xc=7)， 故 在 哈 夫 曼 
算法 的 每 次 合并 时 , 不 能 徐 单 地 找 两 个 权 最 小 的 根 , 还 要 求 它 们 对 应 的 空间 范围 “ 相 邻 ”， 
即 合并 的 条 件 是 : 在 相 邻 的 两 个 根 中 找 权 值 和 最 小 的 。 

对 图 $.38， 最 初 权 最 小 的 两 个 根 是 A 和 下 ， 但 它们 不 相 邻 〈 中 间隔 着 B、C、D 等 区 
段 )， 故 不 合并 ; 相 邻 的 权 值 和 最 小 的 两 个 根 是 A 和 B， 故 对 它们 合并 。A、B 合并 后 形成 


区 间 BA , 它 和 C 相 邻 。 第 二 次 合并 时 找到 的 两 个 根 是 BA 和 C, 它们 合并 后 形成 区 间 CBA ， 
和 D 相 邻 。 第 三 次 合并 时 找到 的 两 个 根 是 E 和 D, 它们 合并 后 形成 区 间 ED ,和 CBA 相 邻 。 
最 后 是 根 ED 和 CBA 合并 ， 最 终结 果 见 图 5.39 的 判定 树 3。 这 时 : 

SUM= NS-p, ,=N(0.15x2+0.2x2+0.35x2+0.2x3+0.1x3)=2.3N 
而 采用 判定 树 1 时 : 

SUM' -=NYpec =N(0.1x4+0.2x4+0.35x3+02x2+0.1SxD=2.8N 

可 见 ， 采 用 最 优 判 定 树 可 使 比较 次 数 下 降 2.8SN-2.3N=0.SN 次 ， 节 省 了 17.9%， 如 果 KN 
很 大 ， 节 省 的 比较 次 数 和 时 间 就 相当 可 观 了 。 

最 后 ， 与 图 5.39 的 判定 树 3 对 应 的 判定 算法 如 下 : 


char classify3(float x) { 


if (x<6) 
iF(%eDy Peturn “EE 
else return ‘D’;) 


Slse TF Toeirnm Cs 
else if (x<8) return ‘'B’; 
else return ‘A’; 

} 


习 融 五 


5.1 树 的 度 是 指 树 中 结 点 的 最 大 上 度数， 但 二 又 树 的 度 就 一 定 为 2 吗 ? 
5.2 己 知 菜 三 又 树 中 度 为 1、2、3 的 结 点 数 分 别 为 nm、n2、ns， 求 其 中 的 叶子 结 点 数 。 
5.3 满 k 又 树 有 mn 个 结 点 ， 则 其 中 叶子 结 点 有 多 少 ? 
5.4 结 点 数 为 n 高 度 也 为 n 的 二 叉 树 是 否 只 有 左 单 校 和 右 单 枝 两 种 ? 
S$.$ 试 回答 下 列 问题 : 
(1) 只 有 3 个 结 上 点 的 树 和 二 叉 树 各 有 几 种 不 同 的 形态 ? 各 有 多 少 标 不同 的 树 ? 
(2) n 个 结 点 的 树 和 二 叉 树 各 有 几 种 不 同 的 形态 ? 
5.6 找 出 所 有 满足 下 面条 件 的 二 又 树 : 
(1) 先 序 序列 和 中 序 序列 相同 。 
(2) 后 序 序列 和 中 序 序列 相同 。 
(3) 先 序 序列 和 后 序 序列 相同 。 
(4) 先 序 、 中 序 、 后 序 序列 都 相同 。 


($) 先 序 序列 和 后 序 序列 相反 。 
5.7 试 回答 下 列 问 题 : 
(1) 中 序 序列 的 最 后 一 个 结 点 是 否 就 是 先 序 序列 的 最 后 一 个 结 点 ? 


(2) 怎样 输出 逆序 的 后 根 序列 ? 
5.8 证 明 : 
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3.10 


(1) 完全 二 叉 树 的 叶子 数 为 no=n-Ln/24 21。 
(2) 严格 二 叉 树 的 叶子 数 为 no=(n+1)/2。 


即 这 两 种 二 又 树 中 叶子 和 非 叶子 结 点 各 有 一 半 左 右 。 
证 明 ; 


(1) 含 n 个 叶子 的 完全 二 又 树 的 结 点 总 数 为 2n-1 或 2n。 
(2) 含 n 个 叶子 的 完全 二 叉 树 的 深度 为 | logyn HH1 或 logyn4+2 (它们 不 一 定 相 等 )。 
(3) 含 n 个 叶子 的 二 叉 树 的 深度 至 少 为 logn H1。 


如 果 某 完全 二 又 树 的 叶子 数 正 好 为 2 的 寡 次 ， 如 n=2™"， 则 该 完全 二 又 树 的 深 


度 就 是 k 吗 ? 


Yd 


5.12 
5.13 
二 叉 树 。 
5.14 
5.15 


证 明 : 对 非 空 树 ，n = 3》 DQG) +1， 即 结 点 数 = 所 有 结 点 的 度数 之 和 +1。 


1=1 
证 明 : 若 森 林 中 有 nm 个 分 支 结 点 ， 则 对 应 二 叉 树 中 有 n+l 个 结 点 没有 右 孩 子 。 
已 知 二 又 树 的 层 序 序列 为 ABCDEFGHIJ, 中 序 序列 为 DBGEHJACIF, 请 面 出 该 


己 知 某 森 林 的 先 根 序列 为 ABCDEFG， 后 根 序 列 为 BCAFEGD， 请 画 出 该 森林 。 
线索 二 又 链表 就 是 用 结 点 的 空 指 针 域 来 存放 某 种 过 历 的 前 趋 和 后 继 线索 ， 是 否 


线索 二 又 链表 中 就 没有 空 指针 了 ? 如 果 有 ， 有 几 个 空 指针 ? 
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试 编写 递归 算法 ， 在 二 又 链表 上 实现 以 下 功能 : 

(1) 求 二 叉 树 的 高 度 。 

(2) 求 二 叉 树 中 上 度 为 1 的 结 点 数 。 

(3) 查找 值 为 x 的 结 点 ， 大 找到 则 返回 该 结 点 的 地 址 ; 否则 返回 空 指针 。 
试 编写 非 递归 算法 ， 在 二 又 链表 上 实现 以 下 功能 : 

(1) 将 二 叉 树 各 结 点 的 左右 子 树 交 换 。 

(2) 求 二 叉 树 中 叶子 结 点 数 。 

试 编写 算法 ， 在 二 又 链表 上 实现 以 下 功能 : 

(1) 求 根 *t 到 任 一 给 定 结 点 *s 的 路 径 〈 或 ， 求 任 一 给 定 结 点 *#s 的 祖先 )。 
(2) 求 任意 两 点 gp 和 *q 的 共同 祖先 。 

试 编写 算法 实现 以 下 功能 : 

(1) 由 二 叉 树 的 顺序 存储 结构 A[1..n] 求 叶子 结 点 数 。 

(2) 由 二 又 树 的 顺序 存储 结构 A[1..n] 建 立 相 应 的 二 又 链表 。 

(3) 由 二 又 链表 建立 相应 的 顺序 存储 结构 A[1..n]。 

试 编写 算法 ， 在 二 又 链表 上 实现 以 下 功能 : 

(1) 判断 二 叉 树 是 否 为 完全 二 又 树 。 

(2) 求 二 叉 树 的 宽度 。 

(3) 求 二 叉 树 的 高 度 、 每 个 结 点 的 层 数 。 

假设 森林 (或 树 ) 用 对 应 的 二 又 链 表 存 储 ， 试 编写 以 下 算法 : 

(1) 求 叶 子 数 、 高 度 。 


(2) 层 序 过 有 历 。 
5.22 ”能 合用 二 又 树 表示 人 父子、 兄弟、 夫妻 三 种 关系 ? 
5.23” 试 编写 一 个 将 百分制 转换 为 五 分 制 的 算法 ， 要 求 平均 比较 次 数 尽 可 能 少 。 假 定 


学 生成 绩 分 布 如 下 
和 级 | E | D | c | el A 


百分比 | 005| 015 | 040 | 030 | 010 
5.24 已 知 两 个 各 有 m 和 n 个 记录 的 有 序 文件 可 在 O(m+m) 的 移动 次 数 内 合并 为 一 个 
有 m+tn 个 记录 的 有 序 文件 。 现 有 5 个 文件 要 合并 为 一 个 大 文件 ， 其 中 记录 数 分 别 有 20、 
30、10、5 和 30 个 。 试 给 出 记录 移动 次 数 最 少 的 合并 步骤 。 


图 是 一 种 比 树 形 结构 更 复杂 的 非 线 性 结构 。 在 树 形 结构 中 , 结 点 间 具 有 分 文 层次 关系 : 
除根 结 点 外 ， 每 个 结 点 只 能 和 其 上 一 层 的 一 个 结 点 相关 ; 除 叶 子 结 点 外 ， 每 个 结 点 可 以 和 
下 一 层 的 多 个 结 点 相关 ， 即 “ 单 前 趋 多 后 继 ”。 而 在 图 结构 中 ， 结 点 之 间 的 关系 是 任意 的 ， 
任何 两 结 点 之 间 都 可 能 相关 ， 从 而 每 个 结 点 可 有 多 个 前 趋 和 多 个 后 继 。 图 是 所 有 数据 结构 
中 最 一 般 的 形式 ， 树 形 结构 、 线 性 结构 和 集合 者 可 看 成 形式 受 限 的 图 。 图 结构 有 极 强 的 表 
达能 力 ， 尤 其 是 可 以 描述 各 种 复杂 的 数据 对 象 ， 因 而 应 用 也 很 广泛 。 

本 章 先 介绍 图 的 概念 ， 然 后 介绍 图 的 存储 方法 及 有 关 图 的 一 些 算法 和 应 用 。 


.1 图 的 概念 


(Graph) 是 由 大 干 个 顶点 与 大 干 条 边 构 成 的 结构 ， 它 的 准确 定义 为 : 图 G 由 两 个 
集合 V 和 EE 组 成 , 记 为 G=(V, EE), 其 中 V 是 顶点 (Vertex) 的 有 穷 非 空 集合 , E 是 边 (Edge) 
的 有 穷 集合 ， 和 而 边 是 V 中 顶点 的 个 对 。 通 音 ， 也 将 图 G 的 顶点 集 和 边 集 分 别 记 为 V(G) 和 
E(G)。E(G) 可 以 是 空 集 ， 若 E(G) 为 空 ， 则 图 G 只 有 顶点 而 没有 边 。 与 其 他 数据 结构 类 似 ， 
图 中 项 点 是 一 些 具体 对 象 的 抽象 ， 边 是 对 象 间 的 关系 。 在 具体 应 用 中 ， 顶 点 与 边 一 般 都 有 
具体 的 含义 ， 如 顶点 代表 城市 ， 边 代表 城市 之 间 的 道路 等 。 

右 图 中 的 每 条 边 都 是 有 方 问 的 ， 则 称 之 为 有 向 图 (Digraph 或 Directed Graph)。 有 问 图 
的 边 是 顶点 的 有 序 偶 对 ， 一 般 用 尖 括 号 表示 。 例 如 ，<vi Vj> 表 示 一 条 有 问 边 ，vi 是 边 的 始 
点 《起 点 ), Vj 是 边 的 终点 。<vi, vi> 和 <vj, vP> 是 两 条 不 同 的 边 。 有 回 边 也 称 为 驱 〈Arc)， 边 
的 始点 称 为 弧 尾 (Tail)， 终 点 称 为 弧 头 (Head)。 例 如 ， 图 6.1 中 Gi 和 Gs 是 有 向 图 ， 其 中 


对 Gi 而 言 ，V={fvu Va, va Va}， E={<Vi, V2>, <V2, V3>, <V3, V2>, <V3, V4>} 。 
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(a) Gi (b) GG CC€ G3 (d) Ga (e) Gs 


6.1 图 的 示例 
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右 图 的 每 条 边 都 是 没有 方 癌 的 ， 则 称 之 为 无 向 图 (Undigraph 或 Undirected Graph )。 无 
器 图 的 边 是 项 点 的 无 序 侦 对 ， 一 般 用 圆 括 号 表示 。 因 此 ，(Vi, vi) 和 (vi, vi 表示 同一 条 边 。 例 
如 ,图 6.1 中 G3 一 Gs 是 无 加 图 ， 其 中 对 G3 而 言 ，V={fvu Vz, va V4}，E={(Vi, V2), (vi V3), (Vi, 
Va), (V2, V3), (V2, V4), (V3, V4)}o 

在 本 间 中 ， 我 们 假定 边 的 两 个 端点 不 相同 ( 即 不 考虑 项 点 到 其 目 喘 的 边 )， 每 条 边 在 
图 中 也 不 重复 出 现 。 这 样 的 图 称 作 人 简单 图 。 

若 图 中 任意 两 个 顶点 之 间 均 有 边 相 连 ， 则 这 种 图 称 为 完全 图 ， 确 切 地 说 ， 有 Ci = 
n(n-1)/2 条 边 的 无 问 图 称 为 无 向 完全 图 (Undirected Complete Graph);， 有 P=n(n-1) 条 边 
的 有 问 图 称 为 有 向 完全 图 (Directed Complete Graph )。 完 全 图 具有 最 多 的 边 数 ， 一 般 情况 
下 , 图 的 项 点 数 n 和 边 数 e 满足 下 述 关 系 : 对 无 问 图 , 0<esnG-1)/2; 对 有 问 图 , 0<e<n(n-1)。 
例如 图 6.1 中 的 Gs 是 具有 4 个 顶点 的 无 问 完 全 图 。 

若 图 中 的 边 数 远 远 小 于 n( 即 e<<nm)， 此 类 图 称 作 稀 朴 图 (Sparse Graph)， 若 e 接近 
于 nm (准确 地 说 ， 对 无 向 图 e 接近 于 n(n-1)/2， 对 有 向 图 e 接近 于 n(n-1))， 此 类 图 称 作 稠 
密 图 (Dense Graph)。 

对 无 问 边 (viy VW), 称 顶点 Vi 和 vi 互 为 邻接 点 (Neighbors), 或 称 vi 和 vi 相 邻 接 (Adjacent); 
对 有 癌 边 <vi vi>， 称 项 点 vi 邻接 到 vi， 顶点 vi 邻接 于 顶点 Vi， 或 者 称 vj 是 vi 的 邻接 点 。 不 
论 边 是 否 有 问 ， 都 称 该 边关 联 (Incident) 于 两 个 疹 点 ， 或 称 该 边 与 两 个 端点 相关 联 。 例 如 ， 
在 图 6.1 的 Gs 中 ， 与 顶点 va 相 邻 接 的 顶点 是 vi、Vv 和 v4， 而 关联 于 顶点 va 的 边 是 (vi V3)、 
(Vz, V3) 和 (V3, Va); 在 Gi 中 , 顶点 vw 的 邻接 点 是 V3, 关联 于 v: 的 边 是 <vi, vz>、<Vv2, V3> 和 <Vi， 
V2>， 顶 点 V4 没有 邻接 点 等 。 

顶点 Vv 的 度 (Degree) 是 指 关 联 于 该 顶点 的 边 的 数目 ， 记 为 D(v)。 对 有 癌 图 ， 把 以 顶 
点 V 为 终点 的 边 的 数目 , 称 为 Vv 的 入 度 (Indegree), 记 为 DG(V); 把 以 顶点 v 为 始点 的 边 的 
数目 ， 称 为 v 的 出 度 (Outdegree)， 记 为 OD(Vv); 显然 项 点 v 的 度 等 于 其 入 度 和 出 上 度 之 和 ， 
即 D(v)=ID(v)+OD(v)。 有 问 边 <vi, Vv 产 也 称 为 Vi 的 出 边 或 vi 的 入 边 。 例 如 ， 对 图 6.1 的 Gi， 
顶点 Vz 的 入 度 为 2， 出 度 为 1， 上 度 为 3。 无论 有 问 图 还 是 无 加 图 ， 所 有 顶点 度数 之 和 等 于 
边 数 的 2 倍 ， 即 3D(v)=2e。 


对 图 G=(V E)， 从 V 中 选 出 阁 干 顶点 组 成 子 集 V'， 从 EE 中选 出 与 V' 中 顶点 相关 联 的 
右 干 边 组 成 子 集 E'， 则 Gs=(VEI) 也 是 一 个 图 ， 称 其 为 G 的 子 图 (Subgraph)。 注 意 ，E' 
中 边 的 端点 要 在 V' 中 ， 否 则 (V' E”) 不 是 图 ， 也 就 不 可 能 是 G 的 子 图 。 图 6.2 给 出 了 有 问 图 
Gi 的 大 干 子 图 ， 图 6.3 给 出 了 无 问 图 G3 的 硅 干 子 图 。 


Pe 
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图 6.2 图 G1 的 若干 子 图 


在 无 问 图 G 中 ， 藻 存 在 一 个 顶点 序列 Vp; Vil? Vi2? “""» Vik， Vq， 使 得 (v， Vil)， (Vil， Wg) en 
(Vxk，Vq) 均 属于 E(G)， 则 称 项 点 vp 到 va 存在 一 条 路 径 〈Path)， 该 路 径 也 可 简单 地 表示 为 
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(Vp, vi vvq。 注 意 ， 路 径 中 人 至少 要 有 一 条 边 。 有 G 是 有 问 图 ， 则 路 人 径 也 是 有 问 的 ， 它 
由 E(G) 中 的 有 同 边 <v vit>, <vit Viz>,…, <Vik Ve> 组 成 ， 也 可 表示 为 <Vp, vit Viz,…, Vqa>。 路 
径 长 度 定 义 为 路 径 上 边 的 数目 。 奋 路 径 上 除了 vp 和 vo 可 以 相同 外 ， 其 余 项 点 均 不 相同 ， 
则 称 此 路 径 为 简单 路 径 。 起 点 和 终点 相同 〈v=va) 的 简单 路 径 称 为 简单 回路 或 简单 环 
(Cycle)。 例 如 ， 在 图 G3 中 ， 顶 点 序列 (Vi, Vz, V3, Va) 是 一 条 从 顶点 Vi 到 顶点 w 的 长 度 为 
3 的 人 简单 路 径 ; 顶点 序列 (Vi, Vz, ve Vi, V3) 是 一 条 从 顶点 Vi 到 顶点 Vi 的 长 度 为 4 的 路 径 ， 
但 不 是 简单 路 径 ; 顶点 序列 (Vi, Vz, V3, Vi) 是 一 个 长 度 为 3 的 俐 单 环 。 在 有 问 图 Gi 中 ， 顶 
点 序列 (Vz, va V2) 是 一 个 长 度 为 2 的 有 问 简 单 环 。 
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图 6.3 图 G3 的 若干 子 图 


在 一 个 有 问 图 中 ， 硅 存在 一 个 项 点 v， 从 该 项 点 有 路 径 可 以 到 达 图 中 其 他 所 有 顶点 ， 
则 称 此 有 问 图 为 有 根 图 ，v 称 作 图 的 根 。 例 如 ， 图 G1 就 是 有 根 图 ， 其 根 为 v1。 

在 无 向 图 中 ， 若 从 顶点 Vv 到 顶点 vi 有 路 径 (当然 从 vi 到 vi 也 一 定 有 路 径 )， 则 称 vi 和 
Vi 是 连通 的 。 夺 图 中 任意 两 个 不 同 的 项 点 都 连通 ， 则 称 该 图 为 连通 图 (Connected Graph )， 
如 图 G3 和 图 G14。 显然 ，n 个 顶点 的 连通 图 至 少 有 mn-1 条 边 〈 对 应 东 种 树 ， 如 图 G4)。 

无 回 图 的 极 大 连通 子 图 称 为 该 图 的 连通 分 量 (Connected Component)。 显 然 ， 任 何 连 
通 图 的 连通 分 量 只 有 一 个 ， 即 其 目 喘 ， 而 非 连 通 的 无 加 图 有 多 个 连通 分 量 。 例 如 ， 图 Gs 
是 非 连通 图 ， 它 有 3 个 连通 分 量 ， 见 图 6.4。 


在 有 问 图 中 ， 硅 任意 两 个 不 同 的 项 点 Vi 和 v;， 都 存在 从 到 vi 以 及 从 vi 到 vi 的 路 和 丛 ， 
则 称 该 图 为 强 连通 图 (Strongly Connected)。 吻 知 n 个 顶点 的 强 连 通 图 至少 有 n 条 边 (对 应 


某 种 有 问 回路 ， 如 图 G,) 或 0 条 边 ( 夺 图 中 只 有 1 个 顶点 )。 

有 问 图 的 极 大 强 连通 子 图 称 为 该 图 的 强 连通 分 量 。 显 然 ， 强 连通 图 只 有 一 个 强 连通 分 
量 ， 即 其 日 映 。 非 强 连通 的 有 问 图 可 有 多 个 强 连 通 分 量 。 例 如 图 Gi 不 是 强 连 通 图 ， 比 如 
v 到 vi 就 没有 路 径 ， 但 它 有 3 个 强 连通 分 量 ， 如 图 6.5 所 示 。 


Q) 
一 (Ww 
图 6.4 ”Gs 的 三 个 连通 分 量 图 6.5 ”G1 的 三 个 强 连通 分 量 


在 连通 图 中 ， 若 删 去 某 顶 点 及 其 相关 联 的 边 后 ， 可 将 图 分 割 成 两 个 或 更 多 连通 分 量 ， 
则 称 该 顶点 为 关节 点 。 例 如 ， 图 6.6 中 的 顶点 vi 就 是 关节 点 。 没 有 关节 点 的 连通 图 为 重 连 
通 图 ， 其 中 任何 一 对 顶点 之 间 至 少 存在 两 条 路 径 ， 删 去 任 一 顶点 及 其 相关 联 的 边 也 不 会 破 
坏 图 的 连通 性 。 若 通信 、 运 输 等 网 络 是 重 连通 的 ， 则 某 个 站 点 ， 或 某 条 边 出 故障 后 ， 因 币 
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下 部 分 仍 连 通 ， 整 个 系统 仍 能 正常 运行 。 

在 将 图 的 每 条 边 都 同上 一 个 权 ， 则 称 这 种 市 权 图 为 网 络 〈Network)。 通 闻 权 是 具有 攻 
种 意义 的 数 ， 如 表示 两 个 顶点 之 间 的 距离 、 耗 费 等 。 图 6.7 就 是 一 个 网 络 例子 。 有 时 根据 
需要 ， 图 中 顶点 也 可 赋 权 。 


图 6.6 ”有 关节 点 的 流通 图 图 6.7 网 络 示例 
在 图 中 也 可 定义 一 些 基 本 运算 ， 如 读 顶 点 、 求 邻 点 、 插 入 〔 顶 点 或 边 )、 删 除 ( 顶 点 
或 边 ) 等 。 为 简单 起 见 ， 本 章 不 讨论 这 些 基本 运算 ， 主 要 研究 图 的 存储 结构 及 一 些 常用 运 
算 的 实现 。 
与 树 和 其 他 结构 类 似 ， 本 章 中 对 图 的 顶点 编号 从 1 开始 ， 相 应 地 ， 对 图 的 存储 和 运算 


中 涉及 的 一 些 数 组 也 从 下 标 1 开始 使 用 。 这 样 对 一 维 数组 要 牺牲 0 号 单元 ， 对 二 维 数组 要 
牺牲 0 列 和 0 行 单元 ， 不 过 这 些 单 元 可 作 其 他 用 途 ， 如 存放 出 度 、 入 度 信息 等 。 这 虽 有 一 
定 的 空间 当 帝 ， 但 使 用 比较 方便 。 如 条 项 点 编号 从 0 开始 、 数 组 下 标 也 从 0 开始 使 用 ， 以 
下 有 关内 容 (主要 是 有 关 数 组 的 下 标 表示 〉 需 上 略 作 修 改 。 
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图 中 任 一 项 点 都 可 能 有 多 个 前 趋 与 多 个 后 继 ， 所 以 无 法 通过 顶点 的 存储 次 序 反映 顶点 
间 的 逻辑 关系 ， 而 必须 显 式 地 存储 顶点 之 间 的 关系 《〈 即 边 ) 信息 。 图 的 存储 方法 较 多 ， 一 
般 根 据 具 体 的 应 用 和 和 欲 施加 的 操作 进行 选择 。 比 如 , 最 简单 地 可 用 一 个 数组 存储 顶点 信息 ， 
用 为 一 个 数组 存储 边 的 信息 ， 这 适合 对 各 边 顺 序 处 理 的 情况 ， 其 他 则 不 方便 (如 边 的 插入 、 
删除 、 碍 找 等 )。 本 区 介绍 两 种 利用 的 存储 结构 : 邻接 矩阵 表示 法 和 邻接 表 表示 法 。 


6.2.1 邻接 矩阵 表示 法 


邻接 矩阵 〈Adjacency Matrix) 是 表示 顶点 之 间 相 邻 关 系 的 矩阵 。 设 G=(V E) 是 具有 mn 
个 顶点 的 图 ， 则 G 的 邻接 和 矩阵 是 具有 如 下 性 质 的 n 阶 方 阵 : 


1] 在 (vivj) 或 < vivij > 是 E(G) 中 的 边 ; 
0: 在 (Vivj) 或 <vivij > 不 是 E(G) 中 的 边 。 

矩阵 的 每 个 元 素 表 示 一 条 边 ， 两 个 下 标 对 应 边 的 两 个 羡 点 。 例 如 ， 图 6.1 中 的 有 问 图 
G1 和 图 6.3 无 四 图 Gs 的 第 2 个 子 图 的 仓 接 算 阵 分 别 为 Al 和 Az: 


Al,]] -| 
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0 1 0 0 0 1 0 1 
0 0 1 0 ] 0 0 0 
Ee A, = 
0 0 1 0 0 0 1 
0 0 0 0 ] 0 1 0 
显然 ， 无 向 图 的 邻接 矩阵 是 对 称 的 ， 有 向 图 就 不 一 定 ， 另 外 ， 邻 接 矩 阵 中 1 的 个 数 对 


无 问 图 为 边 数 的 两 倍 ， 对 有 问 网 则 等 于 边 数 。 

右 G 是 网 络 ， 则 邻接 矩阵 可 定义 为 : 

Ai I 大 (Vi,Vj) 或 <vi,v; >eE(G); 
l 0 或 =: 大 (vi,vj) 或 <Vi,Vj >¢E(G)。 

其 中 ，wi 表示 边 上 的 权 值 ; co 表示 一 个 计算 机 允许 的 、 大 于 所 有 边 上 权 值 的 数 。 对 不 
存在 的 边 ，A[i,]] 取 0 还 是 吕 没有 特别 规定 〈 但 有 关 算 法 要 与 之 一 致 ， 也 可 根据 实际 运算 的 
再 要 或 方便 而 定 )。 例 如 ， 几 6.7 中 市 权 图 的 邻接 答 阵 就 可 有 如 下 3 种 形式 : 

0 ] 3 0 co 0 


0 0 ] SS oo oo 
6 0 S$ 0 3 0 6 oo 5 co 3 oo 
] S$ 0 7 S$ 4 ] 3 co 7 S$ 4 
A, = A 

9 0 7 0 0 2 SS co 7 co co 2 
0 3 S$ 0 0 6 oo 3 5 co oo 6 
0 0 4 2 6 0 oo oo 4 2 6 oo 

0 51 5 ww 部 

6 0 3 co 3 oo 

] SS 0 7 3 4 

站 


cco4 2 6 0 
本 书 采 用 的 是 第 三 种 形式 〈( 见 最 小 生成 树 、 最 短路 径 问 题 ， 它 也 比较 目 然 )。 
邻接 矩阵 一 般 用 二 维 数组 实现 ， 但 它 只 表示 了 顶点 间 的 邻接 关系 ， 要 完整 地 表示 一 个 
图 ， 还 要 表示 顶点 本 喘 的 信息 ， 这 可 男 设 一 个 顺序 表 来 完成 。 
邻接 矩阵 表示 的 类 型 定义 如 下 : 


const int nmax=100; // 顶 点 数 的 最 大 值 ， 假 设 为 100 
typedef struct { 
datatype data[nmax+1]; // 项 点 信息 表 ，0 号 单元 不 用 
mattype adjmat [nmax+1] [nmax+1];  // 邻 接 窍 阵 ，0 行 0 列 不 用 
int n,e; // 顶 点 数 和 边 数 
} mat graph; 
其 中 顶点 信息 表 和 和 邻接 矩阵 都 从 数组 下 标 1 开始 使 用 。 另 外 边 数 e 是 元 余 的 ， 因 为 可 
由 邻接 窍 阵 求 出 边 数 ， 增 加 该 信息 可 方便 一 些 涉及 边 数 的 运算 。 大 图 中 各 顶点 的 信息 仅 是 
一 个 编号 ， 则 不 需要 顶点 信息 数组 。 邻 接 和 矩阵 的 类 型 mattype 可 取 为 char 以 节省 空间 ; 者 


是 网 络 ， 则 取 为 权 的 类 型 ， 如 float。 由 于 无 向 图 或 无 向 网 络 的 邻接 矩阵 是 对 称 的 ， 还 可 采 
用 压缩 存储 的 方法 ， 仅 存储 下 三 角 (或 上 三 角 ) 矩阵 中 的 元 素 ， 并 且 对 角 元 也 不 必 存 储 。 
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显然 ， 邻 接 和 矩阵 表示 法 的 空间 复杂 度 Sm)=O0(*)， 与 边 数 e 无 关 ， 对 稠密 图 比较 有 利 ; 
对 稀 玻 图 则 会 造成 很 大 的 浪费 。 不 过 ， 这 种 存储 结构 没有 链 指针 之 类 的 附加 开销 。 
下 面 给 出 一 个 通过 边 的 信息 建立 无 向 网 络 的 算法 。 其 中 假设 权 的 类 型 为 int， 且 每 个 项 


点 存放 一 个 字符 。 在 边 〈 顶 点 对 ) 的 输入 过 程 中 ， 目 动 累计 边 数 ， 告 输入 的 顶点 号 为 负 则 
输入 结束 。 
void creat ga (mat graph *g) { // 建 立 无 加 网 络 的 邻接 知 阵 
nt 3. n> 
cin>>n; // 读 入 顶点 数 
g—>n=n; 


for(i=1;i<=n;i++) cin>>g->datal[il]; // 读 入 顶点 信息 ， 建 立 顶 点 表 
for (i=1;1i<=n;1i++) 
for (]=17]<=n7]++) 


g->adjmat [i] [j]=0; // 邻 接 算 阵 初始 化 
e=0 7 
while (cin>>i>>j>>w,i>0) { // 读 入 边 的 端点 号 i、j 和 权 w， 建 立 邻 接 窍 阵 
e++; // 累 计 边 数 


g->adjmat [1] [J ]=w; 
g—->adjmat [Jj] [1]=w; 
= 
} 
该 算法 的 执行 时 间 是 O(ntn +e)， 其 中 O(n ) 的 时 间 耗 费 在 邻接 矩阵 的 初始 化 操作 上 。 
由 于 边 数 e<n ， 所 以 ， 算 法 的 时 间 复 杂 度 是 On )。 
根据 邻接 窍 阵 的 特点 ， 下 列 运算 规律 是 显然 的 : 
(1) 检查 图 中 是 否 有 边 (vi, vij) 或 <vi vi>， 只 要 看 对 应 的 矩阵 元 素 ALL j] 是 否 非 去 即 可 。 
(2) 在 图 中 增加 或 删除 一 条 边 ， 只 需 修 改 对 应 的 矩阵 元 素 。 
(3) 对 有 问 图 ， 茶 点 vi 的 出 度 等 于 第 i 行 上 非 零 元 的 个 数 ， 入 上 度 等 于 第 i 列 上 非 零 元 
的 个 数 ， 度 则 等 于 第 1 行 和 第 1 列 上 非 零 元 的 个 数 之 和 。 对 无 回 图 ， 第 工行 或 第 1 列 上 非 夫 


元 的 个 数 束 是 vi 的 上 度 。 
(4) 找 茶 点 的 邻接 点 ， 上 只 需 检 碍 矩阵 对 应 行 上 的 非 去 元 。 


(5) 若 要 求 边 数 e， 须 扫描 整个 矩阵 ， 统 计 其 中 的 非 零 元 个 数 ， 所 耗费 的 时 间 是 O(n 站)， 
与 实际 边 数 无 天 。 
(6) 奋 要 增加 或 删除 一 个 顶点， 则 要 增加 或 删除 矩阵 中 对 应 的 行 与 列 。 


6.2.2 ”邻接 表 表 示 法 


邻接 表 是 图 的 一 种 链 式 存储 结构 ， 类 似 于 树 的 孩子 链表 。 在 这 种 存储 方法 中 ， 对 图 中 
的 每 个 项 点 vi 都 建立 一 个 单 链 表 ， 其 中 记录 所 有 邻接 于 该 点 的 项 点 。 这 个 单 链表 束 称 为 项 
点 Vi 的 邻接 表 (Adjacency List)。 邻 接 表 中 的 每 个 表 结 点 有 两 个 域 ， 其 一 是 邻接 点 域 ， 用 
以 存放 与 Vvi 相 邻接 的 项 点 的 序号 ; 其 二 是 链 域 ， 用 来 将 邻接 表 的 所 有 表 结 点 链 在 一 起 。 如 
果 要 表示 网 络 ， 则 在 每 个 表 结 点 中 增加 一 个 权 值 域 ， 存 放 相 应 边 上 的 权 。 

每 个 顶点 的 邻接 表 都 设置 一 个 表 头 结 点 ， 它 有 两 个 域 : 一 个 是 项 点 域 ， 用 来 存放 项 点 
Vi 的 信息 ; 男 一 个 是 指针 域 ， 用 于 存放 指 问 的 邻接 表 中 第 一 个 表 绪 点 的 头 指 针 。 
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表 结 点 和 表 头 结 点 的 组 成 形式 见 图 6.8， 注 意 这 里 表 头 结 点 和 表 结 点 的 类 型 不 像 一 般 
链表 那样 完全 相同 。 所 有 的 表 头 项 点 可 以 用 单 链 表 的 形式 链 在 一 起 ， 但 一 般 为 了 便于 管理 
和 随机 访问 任 一 顶点 的 邻接 表 ， 将 这 些 表 头顶 点 顺序 存储 在 一 个 癌 量 中 ， 称 为 项 点 表 。 这 
样 ， 图 就 可 以 由 这 个 表 头 问 量 来 表示 。 

显然 ， 对 于 无 回 图 而 言 ，vi 的 邻接 表 中 每 个 表 结 点 都 对 应 于 与 Vi 相关 联 的 一 条 边 ; 对 
于 有 问 图 来 说 ，vi 的 邻接 表 中 每 个 表 结 点 都 对 应 于 以 vi 为 始点 的 一 条 边 。 因 此 ， 我 们 又 将 
无 四 图 的 邻接 表 称 为 边 表 ， 将 有 问 图 的 邻接 表 称 为 出 边 表 。 例 如 ， 对 于 图 6.1 中 的 无 加 图 
G3， 其 邻接 表 表 示 如 图 6.9 所 示 。 

其 中 ， 顶 点 vi 的 邻接 表 中 3 个 表 结 点 的 项 点 序号 分 别 为 2、3 和 4， 表 示 关 联 于 vi 的 
边 有 3 条 (Vi, V2)、(Vi, V3) 和 (vi, V4)。 而 有 问 图 Gi 的 邻接 表 表 示 如 网 6.10 (a) 所 示 ， 其 中 顶 
点 va 的 邻接 表 中 有 两 个 表 结 点 ， 其 顶点 序号 分 别 为 2 和 4, 表示 从 vs 射出 的 两 条 边 <va, v2> 
和 和 <vV3, Vv4>。 


data first no next 


1|v | oT—[2T 4 —[3T 4 [L441 
2|w| 十 -LT 村 [3 村-L4T^] 
3|w | oI 4—[2T4—[4T[ 
表 头 结 点 表 结 点 ‘(| 十 -LT 寺村 [LT 


硕 点 表 边 表 

图 6.8 表 结 点 和 表 头 结 点 形式 图 6.9 Gas 的 邻接 表 
有 向 图 还 有 一 种 称 为 逆 邻 接 表 的 表示 法 ， 该 方法 为 图 中 每 个 顶点 vi 建立 一 个 入 边 表 ， 
入 边 表 中 的 每 个 表 结 点 均 对 应 一 条 以 vi 为 终点 ( 即 射 入 vi) 的 边 。 例 如 ，Gi 的 逆 邻 接 表 如 
图 6.10 (b) 所 示 ， 其 中 vs 的 入 边 表 上 有 两 个 表 绪 点 ， 其 顶点 序号 分 别 为 1 和 3， 表 示 身 


入 v 的 边 有 两 条 <vl, vz> 和 <vVa, V2>。 


站 
3 2|w| - 
3|w| =- 3|w| 十 2 
出 边 表 4|v| - 


(a) Gi 的 邻接 表 (b) Gi 的 道 邻 接 表 
图 6.10 ”Gi1 的 邻接 表 

显然 ， 也 可 把 有 问 图 的 邻接 表 和 北 邻 接 表 组 合 起 来 ， 即 顶点 表 中 每 个 结 点 存放 两 个 指 
针 ， 分 别 指 癌 出 边 表 和 入 边 表 ， 但 这 会 增加 顶点 表 的 指针 开销 。 也 可 把 入 边 表 链接 到 相应 
出 边 表 的 后 面 ， 但 其 中 的 项 点 序号 以 负数 形式 存储 (以 便 区 分 出 边 和 入 边 )， 具 体 略 。 

邻接 表 表 示 的 类 型 定义 如 下 (其 中 边 数 e 也 是 见 余 的 ): 

const int nmax=100; // 顶 点 数 的 最 大 值 ， 假 设 为 100 

typedef struct node * pointer; 

struct node { // 边 表 结 点 

int no; // 邻 接点 域 


pointer next; // 链 域 
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}; 
typedef struct { 


datatype data; // 项 点 信息 
pointer first; // 边 表 头 指针 
} headtype:; // 顶 点 表 结 点 类 型 
typedef struct { 
headtype adjlist[nmax+1]; // 顶 点 表 ，0 号 单元 不 用 
int n,e; // 顶 点 数 和 边 数 
} lk graph; 
如 果 图 中 有 nmn 个 顶点 ，e 条 边 ， 则 邻接 表 震 n 个 表 头 结 点 、e 个 (对 有 问 图 ) 或 2e 个 


(对 无 回 图) 表 结 点 。 因 此 邻接 表 表 示 的 空间 复杂 度 为 S(n, ej=OC+e)。 显 然 ， 对 黎 臣 图 该 
存储 方式 的 空间 利用 率 较 好 ， 这 与 邻接 矩阵 的 情况 正好 相反 。 对 稠密 图 ， 考 虑 到 邻接 表 中 
要 附加 较 多 链 域 ， 邻 接 和 矩阵 表示 法 较 好 。 与 存储 方式 相对 应 ， 如 果 运 算 中 要 对 所 有 的 邻接 
点 进行 处 理 ， 则 邻接 矩阵 表示 和 邻接 表 表 示 的 时 间 复 杂 度 一 般 分别 为 O(n ) 和 O(n+te)。 

下 面 给 出 建立 无 癌 图 邻接 表 的 一 个 方法 。 其 中 假设 每 个 项 点 存放 的 是 一 个 字符 。 首 先 
输入 表 头 数组 的 项 点 信息 data， 并 将 每 个 表 头 的 first 域 置 为 NULL; 然后 读 入 顶点 对 (i,j)， 
生成 两 个 边 表 结 点 ， 其 no 域 分 别 置 为 ] 和 1， 再 将 它们 分 别 插入 到 第 1 个 和 第 j 个 边 表 中 。 
这 里 采用 头 插 法 。 在 项 点 对 输入 过 程 中 ， 目 动 累计 边 数 ， 右 输入 的 顶点 号 1<0 则 结束 。 

void creat gl (lk graph *g) { // 建 立 无 回 图 的 邻接 表 


30 T1711inres 
pointer p; 


cin>>n; // 读 入 顶点 数 
g—>n=n; 
for (i=1;i<=n; i++) f // 读 入 顶点 信息 ， 建 立 顶 点 表 


cin>>g->ad]l1ist[i] .data; 
g—>ad]jl1ist[i] .first=NULL; 
} 


e=0} 
while (cin>>i>>],i>0) { // 读 入 边 的 顶点 对 序号 ， 建 立 边 表 
e+ 二 7 // 累 计 边 数 
p=new node; // 生 成 邻接 点 序号 为 了 的 表 结 点 
p—>no=]; 
p—>next=g—->ad]jlist[1i] .first; 
g—>adjlist[il].first=p; // 将 新 表 结 点 插入 到 顶点 vi 的 边 表 的 头 部 
p=new node; // 生 成 邻接 点 序号 为 i 的 表 结 点 
p—>no=1; 
p—>next=g->ad]jJl1ist[]j]] .first; 
g—>adjlist[j] .first=p; // 将 新 表 结 点 插入 到 顶点 vj; 的 边 表 的 头 部 
} 
g—>e=e; 
} 
显然 该 算法 的 时 间 复 杂 度 是 O(nte)。 建 立 有 癌 图 的 邻接 表 与 此 类 似 ， 只 是 更 加 简单 ， 
每 读 入 一 个 顶点 对 序号 <i > 时 ， 仅 需 生成 一 个 邻接 点 序号 为 j 的 表 结 点 ， 将 其 插入 到 vi 的 
出 边 表 头 部 即 可 。 
对 于 网 络 ， 以 上 在 邻接 表 类 型 定义 时 ， 边 表 结 点 中 要 增加 一 个 数据 域 ， 用 于 存储 边 上 
的 权 ; 而 在 邻接 表 建 立时 ， 边 的 权 值 随 边 的 顶点 对 序号 一 同 输入 并 存 入 到 相应 的 边 表 结 点 


中 ， 具 体 略 。 
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值得 注 间 的 是 ， 一 个 图 的 邻接 矩阵 表示 是 唯一 的 ， 但 其 邻接 表 表示 不 唯一 。 这 是 因为 


邻接 表 表 示 中 ， 各 边 表 中 顶点 的 链接 次 序 取决 于 建立 邻接 表 的 算法 以 及 边 的 输入 次 序 。 以 
上 述 算法 为 例 ， 它 用 头 搬 法 建立 邻接 表 ( 边 表 )， 所 以 大 图 G3 输入 的 边 依 次 为 (1, 2)、(1, 3) 
和 (1, 4) 等 ， 则 图 6.9 中 顶点 vi 的 边 表 中 各 结 点 的 顺序 为 4, 3, 2， 而 不 是 2, 3, 4。 

根据 邻接 表 的 特点 ， 下 列 运算 规律 是 显然 的 : 

(1) 对 无 加 图 ， 第 i 个 边 表 中 的 结 点 个 数 就 是 顶点 vi 的 度 。 对 有 辣 图 ， 第 i 个 边 表 ( 即 
出 边 表 ) 上 的 结 点 个 数 就 是 项 点 vi 的 出 度 ; 求 入 度 较 困难 ， 须 遍历 所 有 的 边 表 ， 累 计 其 中 
邻接 点 域 的 值 为 i 的 表 结 点 个 数 ， 即 为 顶点 i 的 入 度 。 对 北 邻接 表 ， 情 况 正好 相反 ， 求 顶 
点 的 入 度 容易 ， 求 项 点 出 度 较 难 。 


(2) 判断 图 中 是 否 有 边 (vi, Vj) 或 <vi, vi>， 须 扫 摘 第 1 个 边 表 ， 最 坏 时 间 耗 费 为 O(n)。 
(3) 增加 或 删除 一 条 边 (vi, JW)， 需 要 分 别 在 立 和 六 的 邻接 表 中 增加 或 删除 邻接 点 域 中 


顶点 序号 为 j 和 1 的 表 结 点 。 大 是 有 问 边 <vi v>， 则 只 再 要 在 立 的 邻接 表 中 进行 删除 。 
(4) 增加 一 个 顶点， 需要 在 表 头 结 点 数组 中 增加 一 个 元 素 ， 但 删除 一 个 项 点 ， 不 仅 要 
在 表 头 结 点 数组 中 删除 相应 的 结 点 ， 还 要 在 各 边 表 中 删除 与 之 关联 的 所 有 边 。 
(5) 求 边 数 时 需要 扫描 所 有 的 边 表 ， 累 计 其 中 的 表 结 点 数 ， 对 有 问 图 该 数 即 为 边 数 ， 


对 无 问 图 该 数 为 边 数 的 2 倍 ， 所 以 时 间 耗 这 为 On+te)。 

易 见 ， 如 条 将 邻接 定 阵 看 成 黎 牙 是 阵 ， 则 邻接 表 【〈 或 逆 邻 接 表 ) 表示 束 是 黎 焉 窍 阵 的 
行 链表 (或 列 链表 ) 表示 ， 其 中 每 个 边 表 对 应 于 邻接 和 矩阵 的 一 行 ( 或 一 列 )， 边 表 中 顶点 的 
个 数 等 于 该 行 〈 或 列 ) 中 非 支 元 的 个 数 。 与 黎 下 矩阵 的 十 字 链 表 表 示 对 应 ， 图 也 有 类 似 的 
表示 ， 这 就 是 邻接 多 重 表 表示 (对 有 问 图 也 称 为 十 学 链表 表示 )， 具 体 略 。 


63 图 的 遍历 


与 树 类 似 ， 也 可 对 图 进行 珊 历 ， 即 从 某 个 顶点 出 发 ， 沿 看 菜 条 搜索 路 人 径 对 图 中 所 有 顶 
点 都 作 一 次 访问 。 硅 给 定 的 图 是 连通 图 ， 则 从 图 中 任 一 项 点 出 发 顺 看 边 可 以 访问 到 该 图 的 
所 有 顶点 ; 但 大 图 中 有 回路 ， 则 可 能 在 访问 过 程 中 又 回 到 该 项 点 (但 树 中 不 存在 回路 )， 并 
可 能 导致 死 循 环 。 为 了 避免 项 点 的 重复 访问 ， 必 须 为 每 个 顶点 设立 一 个 访问 标志 。 为 此 一 
般 有 两 种 方法 ， 一 种 是 设置 一 个 辅助 数组 visited[1.n]， 它 的 初 值 为 0， 一 旦 访问 了 顶点 vi， 
便 将 visited[ji] 置 为 1; 男 一 种 是 在 图 的 每 个 结 点 中 增设 一 个 访问 标志 域 。 后 一 种 方法 要 修 
改 图 结 点 的 存储 结构 , 除了 初始 未 访问 标志 可 在 建 图 的 同时 建立 外 , 以 后 对 图 进行 届 历 后 ， 
藻 要 清除 访问 标志 则 只 有 上 骨 “ 反 遍历 ”一 次 ,不 方便 。 本 节 以 下 采用 的 是 辅助 数组 的 


方法 。 
与 线性 表 和 树 的 遇 历 不 同 的 是 ， 图 的 遇 历 可 以 从 任 一 点 开始 ， 即 明 历 序列 的 第 一 个 点 
可 以 是 图 中 任 一 点 。 作 为 对 比 ， 线 性 表 亿 历 的 第 一 个 点 一 般 是 线性 表 的 开始 结 点 ， 树 所 历 


的 第 一 个 点 一 般 是 根 〈 如 先 根 过 历 ) 或 左 子 树 中 最 左下 的 点 《如 后 根 过 有 历 )。 
根据 搜索 路 径 的 方 问 不同， 图 有 两 种 利用 的 过 有 历 方法 : 深度 优先 搜索 志 历 和 广度 优先 
搜索 忆 历 ， 分 别 对 应 于 树 的 先 根 忆 历 与 层 序 过 历 。 
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6.3.1 ”连通 图 的 深 度 优先 搜索 志 历 


深度 优先 搜索 (Depth First Search，DFS) 类 似 于 树 的 先 根 过 历 ， 可 认为 是 树 的 先 根 过 


历 的 推广 。 它 的 基本 思想 是 : 在 图 中 任 选 一 顶点 vi 为 初始 出 发 点 ， 首 先 访问 出 发 点 vi 并 
标记 为 已 访问 )， 然 后 依次 搜索 vi 的 每 一 个 邻接 点 w， 若 六 未 访 问 过 ， 则 以 vw 为 新 的 出 发 
点 继续 进行 深度 优先 搜索 ， 依 此 类 推 ， 直 到 访问 完 所 有 和 vi 有 路 径 的 项 点。 这 一 过 程 也 可 


简单 地 描述 为 : 访问 出 发 点 ， 然 后 递归 地 访问 邻接 于 此 点 的 所 有 顶点 。 

这 种 搜索 方法 的 特点 是 尽 可 能 先 对 纵深 方 问 搜索 ， 故 称 为 深度 优先 搜索 。 其 直观 表现 
是 ， 先 沿 某 一 分 文 搜 索 到 尽头 ， 然 后 回 滴 ， 再 沿 男 一 分 文 搜 索 。 在 深度 优先 搜索 过 程 中 ， 
将 得 到 一 个 按 访问 先后 次 序 排列 的 项 点 序列 , 称 为 该 图 的 深度 优先 搜索 遍历 序列 ,条 称 DFS 
序列 。 

以 图 6.11 (a) 的 无 问 图 G 为 例 ， 设 初始 出 发 点 是 Vi， 首先 访问 vi， 并 将 其 标记 为 已 
访问 。vi 有 两 个 邻接 点 Vv 和 v3， 它 们 都 未 访问 过 ， 任 选 一 个 作为 新 的 出 发 点 ， 这 里 假设 选 
V2。 于 是 访问 V2 并 将 其 标记 为 已 访问 ， 册 找 Vv 的 邻接 点 ， 有 VI、V 和 vs 共 3 个 , 但 vi 已 
访问 过 ， 故 在 v 和 vs 中 选 一 个 ,假设 取 w 作为 新 的 出 发 点 。 类 似 ， 继 续 依 次 访问 vs 和 vs。 
访问 vs 后 ， 由 于 它 的 两 个 邻接 点 vs 和 vg 均 已 访问 过 ， 于 是 搜索 回 退 。 先 回 退 到 vs， 但 vs 
的 两 个 邻接 点 也 已 访问 过 ， 继 续 回 退 到 vy。 类 似 又 由 v4 回 退 到 v,，， 再 回 退 到 vi。 这 时 vi 
有 未 访问 过 的 邻接 点 vw， 于 是 以 它 为 新 的 出 发 点 ， 继 续 搜索 ， 依 次 访问 V3、ve、vV7， 最 后 
叉 由 a 器 退 到 V6、V3、YV1lo 此 时 ， V1 的 所 有 邻接 点 都 已 访问 ， 搜索 结束 。 这 个 过 程 得 到 的 
DFS 序列 为 Vi, V2, Va, Vg, Vs, V3, V6, V7。 
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(a) 无 问 图 G 
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(c) 图 G 的 DFS 递归 调用 关系 
图 6.11 深度 优先 搜索 示例 
上 述 执行 过 程 可 用 图 6.11 (b)、(c) 表示 ， 其 中 子 图 (b) 的 包 络 线 表示 搜索 路 线 ， 每 
个 点 都 经 过 了 至 少 一 次 : 第 一 次 经 过 某 点 vv 时 表示 访问 该 点 ， 以 后 再 经 过 该 点 时 表示 回 退 。 
将 搜索 路 线 中 所 有 第 一 次 经 过 的 点 列表 即 得 图 的 DFS 序列 。 子 图 (c) 表示 递归 调用 关系 ， 
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实 线 表 示 递 归 ， 虚 线 表 示 回 退 ， 线 上 的 数学 表示 调用 和 返回 的 次 序 。 

从 上 述 过 程 可 知 ， 图 的 DFS 序列 不 一 定 唯一 ， 首 先 ， 如 果 初 始 出 发 点 不 同 ， 结 果 肯 定 
不 同 ; 其 次 ， 如 果 搜 索 中 某 个 点 有 多 个 未 访问 的 邻接 点 时 ， 则 选取 不 同 的 邻接 点 结果 也 不 
同 。 如 何 找 邻接 点 以 及 选取 哪个 邻接 点 ， 涉 及 图 的 具体 存储 结构 和 算法 。 所 以 ，DFS 序列 
与 算法 、 图 的 存储 结构 以 及 初始 出 发 点 有 关 。 在 初始 点 和 存储 结构 一 定时 ， 如 果 在 选 邻接 
点 的 过 程 中 加 些 约束 ， 如 有 多 个 候选 点 时 取 顶 点 序号 小 的 一 个 ， 则 结果 就 唯一 了 。 

深度 优先 搜索 法 是 递归 定义 的 ， 可 很 容易 地 写 出 其 递归 算法 : 

void DFS(graph g,int V) { 

访问 Vv;visited[v]=1; 
找 出 g 中 的 一 个 邻接 点 w; 
while(w 存 在 ) { 
if (w 未 访问 过 ) DEFS (gw) ; 
w=9 可 中 的 下 一 个 邻接 点 ; 
} 

} 

下 面 分 别 以 邻接 年 阵 和 邻接 表 作 为 图 的 存储 结构 给 出 具体 算法 ,算法 中 假设 visited 为 
全 程 量 ， 且 各 分 量 已 初始 化 为 0， 算 法 如 下 。 


void dfs (mat graph *g,int v) { // 邻 接 和 矩阵 上 DES 遍历 


Tn 汪 
cout<<v<<" ";visited[v]=1; // 访 问 出 发 点 ， 假 设 为 输出 顶点 序号 
for (j=1;j<=n; j++) // 依 次 搜索 v 的 邻接 点 ]， 若 未 访问 ， 则 从 j 出 发 递归 


1f(g->adjmat[v] []]==1 && !visited[]jJ]) dfs(g,]); 
} 
void dfsL(lk graph *g,int v) { // 邻 接 表 上 DFS 遍历 
pointer p; 


cout<<v<<" ";visited[v]=1; ”// 访 问 出 发 点 ,假设 为 输出 顶点 序号 
p=g—->ad]jlist[v] .first; 
while (p!=NULL) { // 依 次 搜索 v 的 邻接 点 ， 知 未 访问 ， 则 递归 


if(!visited[p->no]) dfsL(g,p->no); 
p=p—>next; 
} 

} 

对 算法 dks, 从 出 发 点 v 搜索 时 , 是 在 邻接 矩阵 的 第 v 行 从 左 到 右 寻找 下 一 个 未 访问 过 
的 邻接 点 ， 看 这 种 邻接 点 有 多 个 ， 则 选中 的 是 序号 小 的 那 一 个 。 由 于 图 的 邻接 矩阵 表示 是 
唯一 的 ， 故 对 于 指定 的 初始 出 友 点 ，dk& 算法 对 同一 个 图 得 到 的 DFS 序列 是 唯一 的 。 

对 算法 dfsL， 找 v 的 邻接 点 时 ， 是 在 该 点 的 邻接 表 〈 边 表 ) 中 从 前 问 后 寻找 下 一 个 未 
访问 过 的 邻接 点 ， 奋 这 种 邻接 点 有 多 个 ， 则 选中 的 是 先 找到 的 那 一 个 。 于 是 对 一 个 具体 的 
邻接 表 表 示 来 说 , 从 初始 出 发 点 得 到 的 DFS 序列 也 是 唯一 的 。 但 图 的 邻接 表 表 示 并 不 唯一 ， 
它 取决 于 边 表 中 结 点 的 链接 次 序 , 从 而 对 指定 的 初始 出 发 点 , 由 于 邻接 表 的 不 同 , 算法 dfsL 
对 同一 个 图 得 到 的 DFS 序列 就 不 一 定 唯一 了 。 

对 于 有 mn 个 顶点 e 条 边 的 连通 图 ， 算 法 dfs 和 dfsL 均 递 归 调 用 n 次 。 在 每 次 递归 调用 
时 ， 除 访问 项 点 及 做 标记 外 ， 主 要 时 间 耗 费 在 从 该 项 点 出 发 搜索 它 的 所 有 邻接 点 。 用 邻接 
矩阵 表示 图 时 ， 搜 索 一 个 项 点 的 所 有 邻接 点 需 检 查 和 矩阵 相应 行 中 所 有 的 nm 个 顶点 ， 要 化 谢 
O(n) 的 时 间 , 故 从 nn 个 顶点 出 发 搜索 所 需 的 时 间 是 Oo), 即 dfs 算法 的 时 间 复 杂 度 是 O(n )。 
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用 邻接 表 表 示 图 时 ， 搜 索 n 个 顶点 的 所 有 邻接 点 需 将 各 边 表 结 点 扫 摘 一 过 ， 而 边 表 结 点 的 
总 个 数 为 2e (无 回 图 ) 或 e (有 问 图 )， 故 算法 dfsL 的 时 间 复 杂 度 为 O(nte)。 算 法 dfs 和 
dfsL 所 用 的 辅助 空间 是 标志 数组 和 实现 递归 所 用 的 栈 ， 它 们 的 空间 复杂 上 度 为 O(n)。 

顺便 指出 ，DFS 是 算法 策略 “回溯 法 ”的 基础 ， 它 将 问题 的 候选 解 集 ( 解 空间 ) 组 织 
成 某 种 树 或 图 ,用 DFS 搜索 该 空间 ， 并 采用 一 定 的 规则 避免 移动 到 无 可 行 解 的 子 空间 ， 以 
提高 搜索 效率 。 搜 索 的 同时 产生 可 行 解 ， 空 间 复杂 度 为 O( 最 长 路 径 长 度 )。 


6.3.2 ”连通 图 的 广度 优先 搜索 声 历 


广度 优先 搜索 (Breadth/Width First Search，BFS) 类似 于 树 的 层 序 遍 历 ， 可 认为 是 树 
的 层 序 遍 历 的 推广 。 它 的 基本 思想 是 : 在 图 G 中 任 选 一 顶点 vi 为 初始 出 发 点 ， 首 先 访问 出 
发 点 Vvi( 并 标记 为 已 访问 )， 接 看 依次 访问 vi 的 邻接 点 wl， wz，…，wt， 然 后 ， 依 次 访问 与 
Wi, W2,…, Wt 邻接 的 所 有 未 访问 过 的 顶点 ， 依 此 类 推 ， 直 到 访问 完 所 有 和 vi 有 路 径 的 顶点 。 

上 述 搜索 方法 的 特点 是 尽 可 能 先 横 回 搜索 ， 故 称 为 广度 优先 搜索 。 其 直观 表现 是 ， 从 
出 发 点 开始 ,“ 一 层 一 层 ” 地 进行 搜索 。 从 这 点 上 看 ,广度 优先 遍历 相当 于 对 图 进行 了 分 层 
(与 出 发 点 不 连通 的 结 点 层 数 为 w)。 和 定义 图 的 DFS 序列 类 似 ， 对 图 进行 广度 优先 搜索 通 
历 得 到 的 顶点 序列 ， 称 为 该 图 的 广度 优先 搜索 志 历 序列 ， 人 简称 BFS 序列 。 

以 图 6.11 (a) 的 无 各 图 G 为 例 ， 设 出 发 点 为 Vij， 则 BFS 的 执行 过 程 是 ， 首先 访问 出 
发 点 V1; 它 有 两 个 未 访问 的 邻接 点 V2 和 v3， 设 先 访 问 Vy 骨 访问 V3; 然后 册 先 后 访问 vz 的 
未 访问 过 的 邻接 点 Vy 和 vs， 接 看 先后 访问 vs 的 未 访问 过 的 邻接 点 ve 和 vz; 再 下 来 是 访问 
v 的 未 访问 过 的 邻接 点 vs; 以 后 再 依次 访问 vs、ve、vVz 和 vs 的 未 访问 过 的 邻接 点 ， 但 都 没 
有 ， 搜 索 结 束 。 于 是 得 到 的 BFS 序列 是 Vi, vz, V3, V4, Vs, Ve, V7, Vsg。 

一 个 图 的 BFS 序列 也 不 是 唯一 的 , 它 与 算法 、 图 的 存储 结构 及 初始 出 发 点 有 关 ， 比 如 ， 
在 搜索 中 知 某 个 点 有 多 个 未 访问 的 邻接 点 时 ， 对 它们 按 不 同 的 顺序 访问 ， 结 果 就 不 相同 。 
但 不 难看 到 ， 从 给 定 出 发 点 开始 的 “层次 关系 ”是 相同 的 。 

在 广度 优先 搜索 中 ， 先 访问 的 顶点 其 邻接 点 也 先 访 问 ， 即 有 “先进 先 出 ”的 特点 ， 所 
以 BFS 遍历 算法 要 借助 队列 来 实现 。 非 形式 算法 如 下 : 


void BFS(graph g,int v) { 
初始 化 队列 ; 
访问 Vv;visited[v]=1l;v 入 队 ; 
while ( 队 不 空 ) { 
了 出 队 :; 
找 的 第 一 个 邻接 点 w; 
while (w 存在 ) { 
if (w 未 访问 过 ) {访问 w;visited[w]=l;w 入 队 ;} 
求 的 下 一 个 邻接 点 w; 
} 


} 
} 


该 算法 在 顶点 访问 后 入 队 〈 队 列 中 保存 已 访问 过 的 顶点 )， 若 改 为 出 队 后 访问 《队列 
中 保存 将 要 访问 的 顶点 , 就 像 第 5 章 树 的 层 序 遍 历 那 样 ), 则 出 队 后 要 先 检 测 访 问 标志 后 下 
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访问 (虽然 入 队 时 已 检测 过 )， 这 是 因为 有 些 项 点 可 能 多 次 入 队 而 以 后 也 多 次 出 队 “ 访 问 ” 
《这些 点 是 一 些 顶 点 的 共同 邻 点 ， 但 树 中 不 同 结 点 不 会 有 共同 的 邻 点 一 一 核子 )。 

假设 对 项 点 的 访问 是 输出 项 点 序号 , 并 假设 visited 为 全 程 量 , 且 各 分 量 已 初始 化 为 0， 
分 别 以 邻接 矩阵 和 邻接 表 作为 图 的 存储 结构 ， 则 广度 优先 搜索 算法 如 下 : 


void bfs (mat graph *g,int v) { // 邻 接 窍 阵 上 BFS 遍历 
En 3 
sqqueue Q; / /假设 采用 顺序 队列 
init sqqueue (&Q) ; 
cout<<v<<" ";visited[v]=1; ”// 访 问 出 发 点 ,假设 为 输出 顶点 序号 
en sqqueue (&Q,vVv); 
while(!empty sqqueue (&Q)) { 
de sqqueue (&Q, &v); 
for (J]=1;]<=g—>n;]J++) 
1if(g->adjmat[v] []]==1 && !visited[]j]) 
{cout<<]jJ<<" "“;visited[]j]]=l;en sqqueue (&Q,]J);} 
} 
} 
void bfsL(lk graph *g,int v) { // 邻 接 表 上 BFS 遍历 
sqqueue Q; / /假设 采 用 顺序 队列 
pointer p; 
init sqqueue (&Q) ; 
cout<<v<<™ ";visited[v]=1; // 访 问 出 发 点 ， 假 设 为 输出 顶点 序号 
en sqqueue (&Q,V) 
while(!empty sqqueue (&Q) ) { 
de sqqueue (&Q, &v); 
p=g—>adjlist[v] .first; 
while (p!=NULL) { 
if(!visited[p->no]) 
[CoOuUC<ep S00 ";Vvlisited[p->no]=l;en sqqueue (&Q,p->no);} 
p=p—>next; 
} 
} 
} 


与 深度 优先 遍历 类 似 ,， 对 同一 个 图 和 指定 的 初始 出 发 点 ， 由 于 邻接 矩阵 唯一 ，bfs 算法 
得 到 的 BFS 序列 唯一 ， 由 于 邻接 表 不 唯一 ，bfsL 算法 得 到 的 BFS 序列 不 唯一 (但 对 给 定 
的 邻接 表 其 结果 是 唯一 的 )。 

对 于 具有 mn 个 顶点 和 e 条 边 的 连通 图 , 因为 每 个 项 点 均 出 队 一 次 ,所 以 算法 bfs 和 bfsL 
的 外 循环 次 数 为 n。 算法 bfs 的 内 循环 是 n 次 , 故 算法 bfs 的 时 间 复 杂 度 为 OO )。 算 法 bfsL 
的 内 循环 次 数 取决 于 各 顶点 的 边 表 结 点 个 数 ， 但 内 循环 执行 的 总 次 数 是 边 表 结 点 的 总 个 数 
2e (无 回 图 ) 或 e (有 问 图 )， 故 算法 bfsL 的 时 间 复 杂 上 度 是 O(nte)。 算 法 bfs 和 bfsL 所 用 
的 辅助 空间 是 队列 和 标志 数组 ， 故 它们 的 空间 复杂 上 度 为 O(n)。 

这 些 结果 与 深度 优先 遍历 时 相同 (但 BFS 所 需 队 列 空 间 较 大 时 , DFS 所 需 栈 空间 较 小 ， 


反之 亦 然 )。 
6.3.3” 非 连通 图 的 遍历 
对 一 个 无 向 图 ， 若 它 是 非 连通 的 ， 则 从 图 中 任意 一 个 顶点 出 发 进行 DFS 或 BFS 都 不 


能 访问 到 图 中 所 有 项 点， 而 只 能 访问 到 初始 出 发 点 所 在 的 连通 分 量 中 的 所 有 项 点。 但 如 果 
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从 每 个 连通 分 量 中 都 选 一 个 顶点 作为 出 发 点 进行 搜索 ， 则 可 访问 到 整个 非 连通 图 的 所 有 项 
点 。 因 此 非 连 通 图 的 遍历 必须 多 次 调用 DFS 或 BFS 算法 。 

以 邻接 和 矩阵 为 例 ， 非 连通 图 DFS 壳 历 算法 如 下 : 

void traver (mat graph *g) { / /邻接 矩阵 上 非 连 通 图 的 DFS 遍历 


nt 1 Counts 
for (i=1;i<=n;i++) visited[i]=0;  // 初 始 化 标志 数组 
count=0; 
for(1i=1;1i<=n;1i++) { 
if(!visited[1]) { 
count+i++; 
cout<<" 第 "<<count<<" 个 连通 分 量 : "; 
dfs (g,1); 
canEee yn 
} 
} 
} 


各 算法 traver 只 调用 了 一 次 DFS (或 BFS)， 则 表示 图 是 连通 的 ; 否则 ， 调 用 了 几 次 就 
表示 图 中 有 几 个 连通 分 量 。 例 如 ， 对 图 6.1 (e) 所 示 的 非 连通 图 G;， 执 行 算法 traver 时 ， 
分 别 调用 了 DFS(1)、DFS(5) 和 DFS(6)。 输 出 的 3 个 连通 分 量 是 : 

第 1 个 连通 分 量 : 1 2 4 3 

第 2 个 连通 分 量 : 5 

第 3 个 连通 分 量 : 6 7 

不 论 图 是 否 连通 ,每 个 顶点 都 要 调用 DFS 一 次 ,所 以 算法 traver 的 时 间 复 杂 度 是 O(n )。 

显然 ， 将 上 述 算法 中 的 DFS 调用 换 成 BFS 调用 ， 则 得 到 BFS 遍历 算法 ;将 邻接 矩阵 
换 成 邻接 表 则 得 到 邻接 表 上 的 志 历 算法 ， 但 这 时 算法 的 时 间 复 杂 度 为 Or+e)。 

以 上 讨论 的 各 种 所 历 算 法 是 以 无 辐 图 为 例 的 ， 但 算法 本 映 对 有 问 图 也 是 适用 的 ， 只 是 


要 注意 有 问 图 的 路 人 径 是 有 方 同 的 ， 比 如 ， 辱 从 某 个 顶点 出 发 按 出 度 人 遍历 和 按 入 度 裔 历 得 到 
的 项 点 集 相 同 ， 则 该 顶点 集 即 对 应 一 个 强 连通 分 量 。 
6.4` 生成 树 

在 图 论 中 ， 常 将 树 定 义 为 无 回路 的 连通 图 。 例 如 ， 图 6.12 就 是 两 个 无 回路 的 连通 图 。 


乍 一 看 它们 似乎 不 是 树 ， 但 只 要 选 定 某 个 顶点 做 根 ， 以 树 根 为 起 点 对 每 条 边 定 问 ， 就 能 米 
它们 变 为 通常 的 树 。 由 于 没有 确定 的 根 ， 这 种 图 又 称 为 自由 树 (Free Tree) 或 者 树 图 2。 


6.12 ”两 个 无 回路 的 连通 图 


QD 相应 地 ， 可 把 之 前 讨论 的 有 确定 根 的 树 称 为 有 根 树 (Rooted Tree )。 
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连通 图 G 的 一 个 子 图 如 果 是 一 棵 包含 G 的 所 有 顶点 的 树 ， 则 该 子 图 称 为 G 的 生成 树 
(Spanning Tree)。 由 于 nn 个 顶点 的 连通 图 至少 有 n-l1 条 边 ， 而 所 有 包含 n-1 条 边 及 nm 个 顶 
点 的 连通 图 都 是 无 回路 的 树 ， 所 以 生成 树 是 连通 图 的 极 小 连通 子 图 。 所 谓 极 小 是 指 边 数 最 
少 ， 若 在 生成 树 中 去 掉 任 何 一 条 边 ， 都 会 使 之 变 为 非 连 通 图 ， 帮 在 生成 树 上 任意 添加 一 条 
边 ， 就 必定 出 现 回 路 。 注 意 ， 这 里 的 生成 树 是 从 连通 图 的 观点 出 发 、 针 对 无 向 图 而 言 的 ， 
下 面 还 会 给 出 生成 树 的 另 一 种 定义 ， 对 有 问 图 和 无 各 图 都 适用 。 

对 给 定 的 连通 图 ， 如 何 求 其 生成 树 呢 ? 

设 图 G=(V E)， 在 深度 优先 搜索 或 广度 优先 搜索 中 ， 从 一 个 已 访问 的 顶点 Vi 搜 索 到 一 
个 未 访问 的 邻接 点 vi， 必定 要 经 过 G 中 的 一 条 边 (vi, vj;)。 如 果 G 是 一 个 具有 nm 个 顶点 的 连 
通 图 ， 则 从 G 的 任 一 顶点 出 发 ， 可 将 G 中 的 所 有 mn 个 顶点 都 访问 到 。 这 样 ， 除 初始 出 发 点 
外 ， 对 其 余 n-1 个 顶点 的 访问 一 共 经 过 G 中 的 n-1 条 边 ， 这 些 边 正 好 将 G 的 n 个 项 点 连 
接 成 一 个 极 小 连通 子 图 ， 从 而 得 到 G 的 一 棵 生成 树 。 

具体 地 说 ， 在 算法 dfs (或 dfsL) 中 ， 当 dfsG) 要 调用 dfsQ) 时 ，vi 是 已 访问 过 的 顶点 ， 
vj 是 邻接 于 ii 的 、 未 曾 访问 过 且 正 竺 访问 的 顶点 。 因 而 在 dfs 算法 的 站 语句 中 ， 在 递归 调 
用 dfsQ) 前 插入 适当 的 语句 ， 将 边 (vi, vi) 打 印 或 保存 起 来 ， 就 可 得 到 求生 成 树 的 算法 。 

类 似 地 ， 在 算法 bfs (或 bfsL) 中 ， 帮 当前 出 队 的 元 素 是 w， 竺 入 队 的 元 素 是 w， 则 
Vi 是 已 访问 过 的 顶点 ，Vi 是 待 访问 而 未 曾 访 问 过 的 、 邻 接 于 vi 的 顶点。 因而 在 bfs 算法 的 
站 语句 中 插入 适当 语句 ， 也 可 得 到 求生 成 树 的 算法 。 

由 深度 优先 搜索 得 到 的 生成 树 称 为 深度 优先 生成 树 ， 简 称 为 DFS 生成 树 ; 由 广度 优先 


搜索 得 到 的 生成 树 称 为 广度 优先 生成 树 ， 简 称 为 BFS 生成 树 。 一 般 可 将 初始 出 发 点 看 成 生 
成 树 的 根 ， 这 时 BFS 生成 树 的 高 度 一 般 比 DFS 生成 树 小 。 例 如 ， 从 图 6.11 (a) 的 顶点 vi 


出 发 得 到 的 DFS 生成 树 和 BFS 生成 树 ， 如 图 6.13 所 示 。 


(a) DFS 生成 树 (b) BFS 生成 树 


图 6.13 DFS 和 BFS 生成 树 


由 于 从 图 的 遍历 可 求 得 生成 树 ， 因 此 也 可 以 将 生成 树 定义 为 : 若 从 图 的 某 顶 点 出 发 ， 
可 以 系统 地 访问 到 图 中 所 有 顶点 ， 则 遍历 时 经 过 的 边 和 图 的 所 有 顶点 所 构成 的 子 图 ， 称 作 
该 图 的 生成 树 。 这 个 定义 不 仅 适 用 于 无 加 图 ， 对 有 问 图 也 同样 适用 。 

显然 , 大 G 是 强 连 通 的 有 问 图 ， 则 从 其 中 任 一 顶点 v 出 发 ， 都 可 以 访问 壳 G 中 的 所 有 
顶点 ， 从 而 得 到 以 v 为 根 的 生成 树 。 奎 G 是 有 根 的 有 问 图 ， 设 根 为 vY， 则 从 v 出 发 也 可 以 
完成 对 G 的 遍历 ， 因 而 也 能 得 到 G 的 以 v 为 根 的 生成 树 。 例 如 ， 图 6.14 (a) 是 以 vi 为 根 
的 有 问 图 ， 它 的 DFS 生成 树 和 BFS 生成 树 分 别 如 图 6.14 (b) 和 图 6.14 (c) 所 示 。 有 问 
图 的 生成 树 也 是 有 方 同 的 ， 它 们 属于 有 癌 树 。 
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若 G 是 非 连通 的 无 向 图 ， 则 要 若干 次 从 外 部 调用 DFS (或 BFS) 算法 ， 才 能 完成 对 G 
的 遍历 。 每 一 次 外 部 调用 ， 只 能 访问 到 G 的 一 个 连通 分 量 的 顶点 集 ， 这 些 顶 点 和 遍历 时 所 
经 过 的 边 构 成 该 连通 分 量 的 一 棵 DFS (或 BFS) 生成 树 。G 的 各 个 连通 分 量 的 DFS (或 
BFS) 生成 树 则 组 成 G 的 DFS (或 BFS) 生成 森林 。 


号 Ww 
v © wa Ww 
WW WW 
WW) WW) We 


(a) 以 vi 为 根 的 有 问 图 (b) DFS 生成 树 (c) BFS 生成 树 


6.14 有 向 图 及 其 生成 树 


关 似 地 ,大 G 是 非 强 连通 的 有 问 图 ， 且 初始 出 发 点 又 不 是 有 加 图 的 根 ， 则 遇 历 时 一 段 
也 只 能 得 到 该 有 问 图 的 生成 森林 。 


.5、 最 小 生成 树 


图 的 生成 树 不 唯一 ， 从 不 同 的 项 点 出 发 进行 珊 历 ， 可 以 得 到 不 同 的 生成 树 。 如 果 图 G 
是 一 个 连通 网 络 ， 由 于 边 是 市 权 的 ， 则 其 生成 树 的 各 边 也 是 市 权 的 。 我 们 把 生成 树 中 各 边 
权 值 的 总 和 称 为 生成 树 的 权 ， 并 把 权 最 小 的 生成 树 称 为 图 G 的 最 小 生成 树 (Minimun 
Spaning Tree，MST )。 

生成 树 和 最 小 生成 树 有 许多 重要 的 应 用 。 设 图 G 的 顶点 表示 城市 ， 边 表示 连接 两 个 城 
市 之 间 的 通信 线路 。n 个 城市 之 间 最 多 可 设立 的 线路 有 n(n-1)/2 条 ， 把 n 个 城市 连接 起 来 
全 少 要 有 nr-1 条 线路 ， 则 图 G 的 生成 树 表 示 了 建立 通信 了 网络 的 可 行 方案 。 如果 给 图 中 的 边 
都 赋予 权 ， 表 示 两 个 城市 之 间 通 信和 线路 的 长 度 或 造价 ， 那 么 ， 如 何 选择 n-1 条 线路 ， 使 得 
所 建 通信 网 络 的 总 长 度 最 短 或 总 代价 最 小 ? 这 吏 需 要 构造 该 图 的 一 柠 最 小 生成 树 。 

最 小 生成 树 的 建立 ， 一 般 是 个 逐步 进行 的 过 程 。 这 个 过 程 可 能 有 多 种 方法 ， 其 中 有 一 
种 十 分 有 效 的 方法 ， 其 基本 原则 是 使 每 步 满足 以 下 条 件 : 

(1) 当前 生成 的 图 是 连通 的 。 

(2) 当前 生成 的 图 不 含 回 路 。 

(3) 当前 生成 的 图 是 最 小 生成 树 的 一 部 分 。 

这 是 一 种 贫 心 算法 〈Gready)， 即 “步步为营 ”， 每 一 步 所 做 的 事情 ， 都 是 最 终结 来 所 
必要 的 ， 不 做 任何 “多 余 ” 的 事情 ， 所 以 这 类 方法 的 效率 一 般 较 局 。 按 上 述 原 则 生成 的 图 ， 
一 定 是 最 小 生成 树 ， 该 原则 也 可 作为 证 明 此 类 算法 正确 性 的 一 个 公理 。 

以 下 我 们 只 讨论 无 向 图 的 最 小 生成 树 问题 。 构 造 最 小 生成 树 的 算法 中 大 多 都 利用 了 最 
小 生成 树 的 下 述 性 质 。 
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MST 性 质 : 设 G=(V E) 是 一 个 连通 网 络 ，U 是 顶点 集 V 的 一 个 真子 集 。 若 (u, Vv) 是 G 
中 所 有 的 一 个 冰点 在 里 〈《 即 usU)、 另 一 个 冰点 不 在 里 《〈 即 veV-U) 的 边 中 的 权 值 
最 小 的 一 条 边 ， 则 一 定 存 在 G 的 一 棵 最 小 生成 树 包含 此 边 (u, v)。 

该 性 质 可 用 反 证 法 证 明 : 假设 G 的 任何 最 小 生成 树 中 都 不 
含 边 (u, w。 设 工 是 G 的 一 棵 最 小 生成 树 , 但 不 包含 边 (u, v)。 由 
于 TT 是 树 ， 且 是 连通 的 ， 因 此 有 一 条 从 到 的 路 径 ， 且 该 路 
径 上 必 有 一 条 连接 两 个 顶点 集 U 和 V-=-U 的 边 (u' v'), 其 中 weU， 
v'eV-U， 否 则 u 和 v 不 连通 。 大 把 边 (a v) 加 入 到 树 T， 则 得 到 
一 个 含有 边 (, 岂 的 回路 ， 见 图 6.15。 删 去 边 (u',vV)， 上 述 回 路 即 
被 消除 ， 由 此 得 到 另 一 棵 生成 树 T'"。T' 和 工 的 区 别 仅 在 于 用 边 
(u, Vv) 取代 了 工 中 的 边 (4', v)?。 因 为 (u Vv) 的 权 gs (uv) 的 权 ， 故 
T 的 权 gT 的 权 ， 因 此 工 也 是 G 的 最 小 生成 树 ， 但 它 包含 了 边 (u, wm， 与 假设 矛盾 ! 

本 节 将 介绍 两 个 著名 的 算法 一 一 普 里 姆 (Prim，1957 年 发 表 ) 算法 和 克 鲁 斯 卡尔 
(Kruskal，1956 年 发 表 ) 算法 ， 它 们 都 属于 信心 算法 。 


6.15 ”包含 边 (u,v) 的 回路 


6.5.1 Prim 算法 


设 G=(V, EE) 为 网 络 ， 顶 点 集 为 V={1, 2,…, n}; 最 小 生成 树 为 T=(U, TE)， 其 中 UU 是 T 
的 顶点 集 ，TE 是 T 的 边 集 ; 并 且 将 G 中 边 上 的 权 看 做 边 的 长 度 。 

Prim 算法 的 基本 思想 是 : 首先 从 V 中 任 取 一 个 项 点 uo， 将 生成 树 T 置 为 仅 有 一 个 结 
点 uo 的 树 ， 即 置 U={uo}，TE= 儿 。 然后 只 要 UU 是 V 的 真子 集 , 就 在 所 有 一 个 端点 在 U 中、 
另 一 个 端点 在 U-V 中 的 边 中 ， 找 一 条 最 短 ( 即 权 最 小 〉 的 边 (u, v)， 并 把 该 边 (u, Vv) 加 入 到 
边 集 TE, 顶点 Vv 加 入 到 顶点 集 U。 如 此 进行 下 去 , 每 次 往生 成 树 里 加 入 一 个 项 点 和 一 条 边 ， 
直到 把 所 有 顶点 都 包括 进 生 成 树 T 为 止 。 可 见 ，Prim 算法 是 个 逐步 扩大 U 和 TE 的 过 程 ， 
最 终 必 有 U=V，TE 中 有 mn-1 条 边 。 

关于 Prim 算法 的 正确 性 ， 只 要 说 明 该 算法 满足 上 节 提 到 的 三 项 原则 即 可 ， 证 明 如 下 : 

(1) 每 次 构成 的 部 分 树 是 连通 的 。 最 初 的 部 分 树 只 有 一 个 点 ， 显 然 是 连通 的 。 以 后 每 
次 新 加 入 的 点 对 应 一 条 新 加 入 的 边 ， 而 该 边 有 一 个 端点 属于 原 连通 的 部 分 树 ， 故 新 的 部 分 
树 也 是 连通 的 。 

(2) 每 次 构成 的 部 分 树 是 无 回路 的 。 因 为 每 次 加 入 的 边 的 两 个 靖 点 原 属于 两 个 不 同 集 
合 U 和 V=-U， 不 可 能 构成 回路 。 只 有 两 个 站 点 同 在 U 中 才 有 可 能 构成 回路 。 

(3) 每 次 构成 的 部 分 树 是 最 小 生成 树 的 一 部 分 。MST 性 质保 证 了 每 次 加 入 的 边 和 顶点 
是 最 小 生成 树 的 边 和 顶点 。 

显然 ，Prim 算法 的 关键 是 如 何 找到 连接 U 和 V-U 的 最 短 边 来 扩充 生成 树 。 设 当前 生 
成 的 工 中 有 个 顶点 ， 则 连接 U 和 V-U 的 边 有 ka- 区 条 〈 知 两 点 间 没 有 边 ， 则 设想 有 一 
条 长 上 度 为 oo 的 虚拟 边 )。 知 每 次 都 直接 从 如 此 多 的 边 中 选取 一 个 最 短 边 ， 则 运算 量 大 ， 效 率 
不 高 , 因为 找 当 前 最 短 边 要 进行 一 系列 比较 ,而 这 些 比较 很 多 在 以 前 找 最 短 边 时 已 进行 过 ， 
但 没有 把 结果 保留 下 来 ， 导 致 很 多 重复 的 比较 。 

为 此 ， 可 构造 一 个 较 小 的 候选 边 集 ， 且 保证 最 短 边 属 于 该 候选 边 集 。 注 意 到 对 于 V-U 
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中 的 每 个 点 ， 它 到 TU 的 各 边 中 ， 都 有 一 条 自己 的 最 短 边 〈 为 叙述 方便 ， 以 下 简称 为 该 点 的 
最 短 边 )， 这 些 边 共 有 n-k 条 ， 其 中 的 最 短 边 也 就 是 原 k(n--k) 条 边 中 的 最 短 边 ， 所 以 我 们 
把 这 些 边 作为 候选 边 集 。 于 是 ,扩充 工 就 是 从 候选 边 集 中 选 出 最 短 边 (u Vv)， 将 它 连 同 顶 点 
v 加 入 到 工 中 。 此 时 ，V-U 集中 原来 与 v 相连 的 边 变 成 了 连接 新 的 V-U 和 TU 的 候选 边 。 
这 时 ， 可 对 候选 边 集 进行 如 下 调整 : 若 原 V-U 集中 ， 点 i 的 最 短 边 大 于 新 的 候选 边 (v, iD)， 
则 以 (v, iD 作为 ii 的 新 最 短 边 ; 否则 i 的 最 短 边 不 变 。 
Prim 算法 的 非 形式 描述 如 下 : 
置 fT 为 任意 一 个 顶点 ， 
求 初始 候选 边 集 ; 
while (T 中 结 点 数 <n) { 
从 候选 边 集中 选取 最 短 边 (u,v) ; 
将 (u,v) 及 顶点 v， 扩 充 到 T 中 ; 
调整 候选 边 集 ; 
} 
图 6.16 给 出 了 一 个 例子 说 明 按 上 述 算法 构造 最 小 生成 树 的 过 程 : 
开始 时 , 取 顶 点 集 U={}，V 一 U={2, 3, 4, 5, 6}， 初 始 的 候选 边 集 是 V-U 的 5 个 点 与 U 
的 顶点 1 所 关联 的 最 短 边 ， 如 图 6.16 (b) 所 示 。 其 中 ， 顶 点 5 和 6 与 顶点 1 没有 关联 边 ， 
取 它 们 的 最 短 边 为 无 穷 大 。 在 这 5 条 最 短 边 中 ， 边 (1, 3) 的 长 度 最 短 ， 因 此 ， 将 该 边 扩 充 到 
T 中 ，U={1,3}。 
因为 顶点 3 加 入 U， 候 选 边 集 调整 如 下 : 顶点 2 的 原 最 短 边 (1, 2) 的 长 度 为 6， 而 新 候 
选 边 (3, 2) 的 长 度 为 5， 比 前 者 小 ， 因 此 用 (3, 2) 取 代 (1, 2) 作 为 顶点 2 的 最 短 边 ， 同 理 ， 用 新 
候选 边 (3, 5) 和 (3, 6) 分 别 取代 顶点 5 和 6 的 原 最 短 边 (1, 5) 和 (1, 6); 顶点 4 的 原 最 短 边 (1, 4) 
长 度 为 S， 小 于 新 候选 边 (3, 4) 的 长 度 7， 所 以 顶点 4 的 最 短 边 不 变 。 调 整 后 的 候选 边 集 如 
图 6.16〈c) 的 4 条 虚线 所 示 。 选 择 其 中 最 短 的 一 条 边 (3, 0) 扩充 到 工 中 ，U=11, 3, 6}。 
如 此 进行 下 去 ， 最 终 得 到 的 生成 树 T 即 为 所 求 的 最 小 生成 树 ， 如 图 6.16 〈g) 所 示 。 
若 候 选 边 集中 的 最 短 边 不 止 一 条 时 ， 可 任 选 其 中 的 一 条 扩充 到 T 中 ， 因 此 ， 连 通 网 络 
的 最 小 生成 树 不 一 定 唯 一 , 但 它们 的 权 是 相等 的 。 例 如 在 图 6.16 (e) 中 大 选取 的 最 短 边 是 
(3, 5) 而 非 (3, 2) 时 ， 则 得 到 另 一 棵 最 小 生成 树 ， 如 图 6.17 所 示 。 
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图 6.16 Prim 算法 构造 最 小 生成 树 的 过 程 6.17 6.16 (a) 
的 另 一 棵 MST 
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从 图 6.16 可 以 看 到 ， 在 Prim 算法 的 各 个 中 间 时 刻 ， 己 生成 的 树 与 候选 边 集中 的 所 有 
边 一 起 可 构成 一 榨 生 成 树 ， 但 不 一 定 是 最 小 生成 树 。 


上 述 过 程 也 可 用 表 6.1 表示 ， 其 中 方 括号 内 的 数值 为 项 点 的 候选 边 长 度 ， 阴 影 部 分 表 
示 已 选 出 的 项 点 (及 边 )， 但 不 如 图 形 表示 人 简洁。 


表 6.1 Prim 算法 求 最 小 生成 树 的 过 程 


最 短 边 
(u, V) 


oo 0 [5] 本 (1, 3) 12.3.456 | 0 
候选 边 终点 [ 边 长 加 加 加 ”EO 四 
候选 边 终点 [长 | | 35 3 ec | .369 | 2 | ©、 
RUKAU| | | ll colosesl oo | 0 
wa ll ho ro 

下 面 讨论 Prim 算法 的 实现 。 设 连通 网 络 用 邻接 窍 阵 表 示 ， 对 不 存在 的 边 ， 相 应 的 窍 阵 
元 素 为 wo〈 实 取 为 计算 机 允许 的 最 大 数 ， 也 可 取 为 大 于 所 有 边 权 的 一 个 数 )。 

边 的 存储 结构 如 下 : 


struct { 
int end; // 最 短 边 的 终点 (起 点 是 候选 点 目 己 ) 
int len; // 边 长 ， 假 设 权 为 整数 


} minedge [nmax+1]; // 候 选 边 集 ，nmax 为 顶点 数 最 大 值 。 数 组 下 标 从 1 开始 使 用 


其 中 ， 候 选 边 按 候 选 点 的 序号 排列 ， 边 的 序号 就 是 候选 点 号 ， 也 就 是 候选 边 的 起 点 ， 
故 候选 边 信 息 中 没有 存放 起 点 信息 。 假 设 候选 边 集 数组 为 全 局 量 ， 则 Prim 算法 如 下 : 
void prim(mat graph *g,int u) { // 从 顶点 u 出 发 构造 最 小 生成 树 
int v,k,]J,min; 


for (v=l1;v<=g->n;v++) { / /初始 化 ， 构 造 初始 候 选 边 集 


minedge[v] .end=u; 
minedge[v] .len=g—->adjmat[v] [ul]l; 


} 
minedge [ul] .len=0; // 顶 点 uu 并 入 UU 集 ， 边 权 置 0 避 人 急 重 复 选取 
for (k=]1; Kk<g—>n; k++) { // 依 次 找 n-1 条 最 短 边 
min=INT MAX:; //INT_MAX 为 整数 最 大 值 ， 表 示 ~ 
v=0; //V 用 于 记录 最 短 边 号 (此 处 可 不 必 设 初 值 ) 
for (]=17]j<=gq->n7]++) // 在 候选 边 集 中 找 最 短 边 


If(minedgqe[]]. Len>0 && mlineddqde[]].1Len<min) { 
mlIn=mlnedqe[]] .1Len:; 
V=]; 
} 
if (min=INT MAX) {cout<<" 图 不 连通 ， 无 生成 树 ! ";exit (0);} 
cout<<v<<" "<<minedge[v] .end<<endl:; // 输 出 生成 树 的 边 
minedge[v] .len=-minedge[v] .len; // 顶 点 并 入 U 集 ， 边 权 置 负 避 倪 重 复 选取 
for (j=1;j<=g->n; j++) / /调整 候选 边 集 
1If(g->ad]mat[]] [vl]<minedge[]jJ].len) { 
mlineddqe []] .len=g->adjmat []] [v]; 
minedge[]] .end=v; 
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} 
} 
} 


显然 ， 该 算法 的 时 间 复 杂 度 为 O(n”) ， 与 边 数 无 关 ， 对 稠密 图 比较 有 利 。 

算法 结束 后 ，minedge 中 权 为 锋 的 边 就 是 生成 树 的 n-1 条 边 。 通 过 边 集 表示 生成 树 ， 
可 直接 表达 结 点 间 的 连通 关系 ， 当 然 也 表达 了 树 的 全 部 信息 。 

上 述 算法 中 查找 最 短 边 的 部 分 还 可 进行 修改 ， 如 将 已 生成 的 边 移 到 数组 的 前 面 ， 以 后 
可 只 在 数组 的 后 面 找 最 短 边 ， 可 提高 得 找 效 率 〈 但 这 时 边 的 序号 不 能 反映 边 的 起 点 ， 需 要 
在 边 的 存储 结构 中 增加 起 点 信息 ) 又 如 采用 小 根 堆 〈 见 第 7 章 堆 排序 ) 来 找 最 短 边 ， 侍 找 
的 效率 还 可 提高 到 O(nlogzan)。 但 调整 部 分 不 变 ， 总 的 时 间 复 杂 度 仍 为 O(n”)。 


6.5.2 Kruskal 算法 


Prim 算法 每 一 次 都 从 连接 UU 与 V-U 的 候选 边 中 选 最 小 边 ， 但 它 不 一 定 是 所 有 当前 未 
选用 的 但 属于 最 终 最 小 生成 树 的 边 中 最 小 者 ， 因 为 此 时 还 有 两 个 端点 都 在 V-U 的 边 没有 
考虑 。 换 言 之 ，Prim 算法 不 是 按 边 权 递增 的 次 序 生成 最 小 生成 树 的 。 

构造 最 小 生成 树 的 另 一 个 算法 是 克 鲁 斯 卡尔 (Kruskal) 提出 的 ， 它 的 基本 思想 是 按 边 
权 递 增 次 序 生成 最 小 生成 树 。 即 铬 某 边 是 最 小 生成 树 中 第 i 小 的 边 ， 则 它 在 第 1 一 第 (1) 
小 的 边 全 部 选 出 后 才 加 入 到 中 间 的 部 分 结果 中 。 

Kruskal 算法 的 基本 过 程 为 : 设 G=(V, E) 是 连通 网 络 , 令 最 小 生成 树 的 初始 状态 为 只 有 
n 个 顶点 而 无 边 的 非 连通 图 T=(V, 儿 )，T 中 每 个 项 点 目 成 一 个 连通 分 量 。 以 后 按 长 度 递增 
的 顺序 依次 选择 EE 中 的 最 短 边 (u,v)， 奎 其 端点 u、v 分别 属于 当前 工 的 两 个 连通 分 量 Ti、 
T， 则 将 该 边 加 入 到 工 中 ，Ti 和 了 T 也 由 此 边 连 成 一 个 连通 分 量 ; 车 u、v 属于 当前 同一 个 
连通 分 量 ， 则 人 铭 去 此 边 〈 因 为 每 个 连通 分 量 都 是 一 棵 树 ， 此 边 添加 到 树 中 将 形成 回路 )。 依 
次 类 推 ， 直 到 工 中 所 有 顶点 都 属于 同一 个 连通 分 量 为 止 ， 工 便 是 G 的 一 棵 最 小 生成 树 。 

对 图 6.16 (a) 所 示 的 连通 网 络 ， 按 Kruskal 算法 构造 最 小 生成 树 ， 其 过 程 如 图 6.18 
所 示 。 第 一 次 取 最 短 边 (1, 3)， 它 连接 两 个 不 同 的 连通 分 量 ， 故 将 它 加 到 工 ， 类 似 ， 依 次 取 
边 (4, 6)、(3, 6)、(2, 9)， 将 它们 加 到 工 中 ， 如 图 6.18 (b) 一 〈d) 所 示 。 接 着 考虑 当前 最 
短 边 (1, 4)、(2, 3) 和 (3, 5)， 它 们 的 长 度 相同 ， 但 边 (1, 4) 的 两 个 端点 属于 同一 个 连通 分 量 ， 
舍 去 。 边 (2, 3) 和 (3, 9) 都 符合 要 求 ， 这 里 不 妨 选 择 边 (2, 3) 加 入 T， 见 子 图 (e)。 子 图 〈e) 
为 单个 连通 分 量 ， 它 就 是 所 求 的 一 棵 最 小 生成 树 。 如 果 在 子 图 (d) 中 选择 边 (3, 5) 而 不 是 
边 (2, 3)， 将 它 添加 到 当前 的 TT 中 ， 则 得 到 男 一 棵 如 图 6.17 所 示 的 最 小 生成 树 。 
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图 6.18 ” Kruskal 算法 构造 最 小 生成 树 的 过 程 
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由 于 每 个 连通 分 量 都 是 一 棵 树 ， 它 们 构成 森林 (初始 有 n 村 树 )， 随 大 算 法 的 进行 ， 
和 森林 中 的 树 逐 步 连通 (合并 ), 最 后 合并 为 一 棵 树 , 即 为 所 求 得 的 最 小 生成 树 。 可 见 , Kruskal 
算法 是 按 边 权 递增 的 次 序 连 通 森 林 的 。 下 面 给 出 Kruskal 算法 的 粗略 描述 : 

I=(V, 作 ) ; 

while(T 中 所 含 边 数 <n-1) { 

从 互 中 选取 当前 最 短 边 (u,v) ,并 从 瑟 中 删 去 之 ; 
if ( 边 的 端点 u,v 属于 不 同 连通 分 量 ) {将 边 (u,v) 并 入 了 中 ;合并 两 个 连通 分 量 ; } 

} 

Kmskal 算法 中 要 判断 边 的 两 个 端点 是 否 属于 同一 连通 分 量 , 以 及 合并 两 个 不 同 的 连通 
分 量 "。 对 同一 连通 分 量 的 判断 若是 从 边 的 一 个 端点 出 发 遍历 搜索 另 一 个 端点 ， 则 显然 效 
率 很 低 。 一 个 简单 方法 是 设置 一 个 辅助 数组 sets[1..n]， 记 录 每 个 顶点 的 连通 分 量 号 ， 初 始 
时 sets[i]=i。 这 样 ， 对 任 一 边 (vi, vj)， 若 sets[i]j-setsj]， 则 两 端点 在 同一 连通 分 量 。 但 每 次 
合并 两 个 连通 分 量 时 ， 要 扫描 辅助 数组 ， 将 其 中 一 个 连通 分 量 中 所 有 点 的 连通 分 量 号 改 为 
另 一 个 ， 运 算 量 为 O(n)。 

较 好 的 方法 是 将 各 个 连通 分 量 用 树 来 记录 : 开始 时 ， 每 个 树 只 有 一 个 根 ， 以 后 每 次 合 
并 两 个 连通 分 量 时 ， 就 将 两 棵 树 合并 为 一 棵 树 ， 这 只 要 简单 地 使 其 中 一 个 树 根 成 为 男 一 个 
树 根 的 孩子 即 可 。 这 样 ， 检 查 两 个 端点 是 否 属于 同一 个 连通 分 量 ， 只 要 检查 它们 所 在 树 的 
根 是 否 相 同 。 为 此 ， 每 个 结 点 需要 设置 双亲 指针 ， 以 便 能 沿 双 亲 指 针 找到 根 。 显 然 ， 找 到 
根 的 效率 取决 于 树 的 高 度 。 

为 了 降低 树 的 高 度 ， 可 在 找 根 的 过 程 中 “顺便 ”把 路 径 上 各 结 点 的 双亲 指针 往 上 提 ， 
如 改 为 指向 祖父 结 点 或 者 干脆 指向 根 。 这 个 过 程 可 减少 以 后 查找 的 结 点 数 ， 但 增加 了 修改 
指针 的 开销 。 另 一 个 背 用 的 方法 是 ， 在 合并 树 时 ， 令 结 点 数 少 的 树 作 另 一 个 树 的 子 树 。 这 
需要 在 树 根 中 记录 结 点 数 ， 但 不 必 采 用 专门 的 存储 空间 ， 可 将 结 点 数 以 负数 的 形式 记录 在 
原 树 根 的 双 杀 域 中 ， 约 定 只 要 双 杀 域 为 负 ， 就 表示 它 为 树 根 。 这 时 树 的 高 度 最 大 为 
[logan 上 +19， 每 次 合并 的 运算 量 是 Odlogzm)。 最 后 算法 如 下 : 


typedef struct { 
1nt VI v2; 


int len; 
} edgetype; // 边 的 类 型 : 两 个 端点 号 和 边 长 
int parent [nmax+1]; // 结 点 的 双亲 指针 数组 ， 设 为 全 局 量 ，nmax 为 结 点 数 最 大 值 
int getroot(int v) { // 找 结 点 vV 所 在 的 树 根 
int 工 ; 
i=V; 
while (parent [1I]>0) i=parent [1]; 
return i; / /车 无 双亲 (初始 点 ) ， 双 杀 运 算 结果 为 其 目 己 
} 
int getedge (edgetype E[],int e) {……… }// 找 最 短 边 (内 容 略 ) 


void kruskal (edgetype E[],int n,int e) {//n 为 结 点 数 ，e 为 边 数 
int i,pl,p2,m,10; 


Q) 类 似 问题 的 一 般 模型 是 并 查 集 : 集合 的 主要 运算 是 “并 ”( 集 合 的 合并 )、“ 查 ”( 查 找 元 素 所 属 的 
集合 )。 具 体 实 现时 可 把 集合 的 元 素 组 织 成 数组 、 链 表 或 树 等 ， 其 中 组 织 成 树 时 效果 较 好 。 

@ n=1 时 显然 成 立 。 设 i<n-1 时 成 立 ， 则 ina 时 ， 设 最 后 合并 的 两 个 树 为 ]、k， 结 点 数 分 别 为 m 和 
n-m, 不 妨 设 1 和 ms<n2， 则 j 成 为 k 的 子 树 。 于 是 新 树 的 高 度 要 么 与 k 的 相同 ， 要么 比 j 的 大 1。 对 前 者 ， 
新 树 高 度 <|Llogsy(n-m) 上 1<|1ogyn +1; 对 后 者 ， 新 树 高 度 <[logym1+2<| logym/21+2<|1logyn+1。 
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for (i1=1; i1<=n; i++) 


Parent [i1]=-1; / /每 个 初始 连通 分 量 只 有 一 个 根 结 点 ， 无 双亲 (双亲 和 置 负 ) 
m=]; 
while(m<n) { 

i0=getedge (E,e); // 获 得 最 短 边 号 


pl=getroot (了 [10] .v1); 
p2=getroot (下 [10] .v2); 
if (pl==p2) continue; / /连通 分 量 相同 ， 不 合并 


if (pl<-p2) { / /pl 的 结 点 数 较 少 
parent [p2] =parent [pl]+parent[p2]; //p2 的 双亲 中 累计 结 点 总 数 (为 负 值 ) 
parent [pl1] =p2; / /pl 作为 p2 的 子 树 

} 

else { 


parent [pl]=parent [pll]+parent [p21]; 
parent [p2]=pl; 
} 
Im 十; 
cout<<"The Edge "<<m<<" 1is: "<<E[10] .vli<<"™" "<<E[10] .v2<<endl; 
} 
} 


算法 初始 化 的 时 间 为 OA; 找 最 短 边 时 ， 大 是 简单 地 对 各 边 进行 扫 摘 ， 每 次 时 间 为 
O(e)， 找 全 部 最 短 边 的 时 间 则 为 O(e*) ， 但 若 把 各 边 组 织 成 小 根 堆 《〈 见 第 7 章 堆 排序 )， 则 
找 最 短 边 的 时 间 除 了 第 一 次 为 O(e) 外 ， 其 他 每 次 都 不 超过 堆 的 深度 O(log,e)， 故 找 全 部 最 
短 边 的 时 间 不 超过 O(elog,e) ; 判断 连通 分 量 的 时 间 不 超过 树 的 高 度 O(log,n) ， 对 连通 分 量 
的 全 部 判断 时 间 不 超过 O(elog,n) ; 连通 分 量 合并 n-1 次 ， 时 间 为 O(n)。 所 以 总 时 间 不 超 
过 O(n) +O(elog,e)+O(elog,n)+O(n) 。 由 于 连通 图 的 边 数 ez>n-1l1， 上 所 以 O(n)<O(e)， 
O(log,n) < O(log,e) ， 最 后 总 的 时 间 复 本 上 度 为 O(elog,e) 。 

可 见 ，Kruskal 算法 的 时 间 复 杂 度 与 网 络 中 边 的 数目 e 有 关 , 对 求 黎 疏 图 的 最 小 生成 树 
比较 有 利 。 


(6.6 ” 最短 路径 


路 径 问 题 是 图 中 的 又 一 基本 问题 ， 很 多 实际 问题 都 可 抽象 或 归纳 为 最 短路 径 问 题 。 比 
如 交通 网 络 中 常 弟 提出 这 样 的 问题 ， 两 地 之 间 是 否 有 路 相通 ? 在 有 多 条 通路 的 情况 下 ， 哪 
一 条 最 短 ? 人 交通 网 络 可 以 用 市 权 图 表示 , 图 中 顶点 表示 城镇 , 边 表 示 两 个 城镇 之 间 的 道路 ， 
边 上 权 值 可 表示 两 城镇 间 的 距离 、 交 通 费 用 或 途中 所 需 的 时 间 等 。 以 上 提出 的 问题 束 是 这 
权 图 中 求 最 短路 径 的 问题 ， 即 求 两 个 顶点 间 长 度 最 短 的 路 径 。 这 里 路 径 长 度 不 是 指 路 径 上 
边 的 个 数 ， 而 是 指 路 径 上 各 边 的 权 值 总 和 ， 它 的 具体 含义 取决 于 边 上 权 值 所 代表 的 意义 。 

两 地 之 间 由 于 上 坡 、 下 坡 ， 顺 水 、 逆 水 等 不 同 ， 来 回 所 花 的 时 间 一 般 也 会 不 同 。 考 虑 
到 交通 网 络 的 这 种 有 同性 ， 本 节 只 讨论 有 癌 网 络 的 最 短路 径 问 题 。 习 惯 上 称 路 径 的 开始 顶 
点 为 源 点 〈Source)， 路 径 的 最 后 一 个 顶点 为 终点 〈Destination)。 为 了 讨论 方便 起 见 ， 设 项 
点 集 V={f1 2,，…,n}， 并 假定 所 有 边 上 的 权 值 均 是 表示 长 度 的 非 负 整数 。 
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6.6.1 音源 最 短路 径 


单 源 (Single-source) 最 短路 径 问 题 是 : 对 于 给 定 的 有 问 网 络 G=(V, E) 及 单个 源 点 V， 
求 Vv 到 G 的 其 余 各 顶点 的 最 短路 径 。 也 许 实际 问题 上 只 关心 茶 两 点 间 的 最 短路 径 ， 但 遗憾 的 
是 ， OO Eh EE Ge ty 关 
于 这 类 问题 ,， 傈 兰 籍 计 算 机 科学 家 Dijkstra 在 1959 年 首先 给 出 了 一 个 成 熟 的 算法 ， 一般 称 
之 为 Dijkstra eg 

在 有 问 网 络 中 ， 从 某 点 出 发 ， 到 达 其 他 任何 一 点 都 可 能 有 多 条 路 径 ， 其 中 必 有 一 条 最 
短路 人 径 ( 硅 没有 路 人 笃 ， 则 假设 路 径 是 长 上 度 为 无 穷 大 的 虚拟 路 人 径 )。 设 图 共有 nn 个 项 点, 于 是 
从 某 一 点 出 发 到 其 他 各 点 的 最 短路 径 有 n-1 条 。 这 n-1 条 最 短路 径 之 间 也 存在 大 小 关系 。 
例如 ， 对 图 6.19 所 示 的 有 向 网 络 , n=5， 阁 求 顶 点 1 到 其 他 各 顶点 的 最 短路 径 ， 则 有 n-1=4 
条 ， 将 它们 按 长 度 递增 的 次 序 排列 ， 见 表 6.2。 


表 6.2 图 6.19 Si 1 0 


图 6.19 有 向 网 络 


从 图 6.19 及 表 6.2 可 见 ， 如 果 按 长 度 北 增 的 次 序 生成 源 点 v 到 其 他 顶点 的 最 短路 径 ， 
则 当前 正在 生成 的 项 点 w 的 最 短路 入 上 除 终 点 以 外 ,其 余 中 间 项 点 的 最 短路 径 均 已 生成 ( 
为 它们 的 最 短路 径 长 度 比 当前 顶点 w 的 最 短路 径 短 )。 

Dijkstra 算法 束 是 按 长 度 递 增 的 次 序 生成 各 项 点 的 最 短路 径 , 即 先 求 出 长 度 最 小 的 一 条 
最 短路 径 ， 然 后 求 出 长 度 第 二 小 的 最 短路 径 ，…… ， 最 后 求 出 长 度 最 大 的 最 短路 径 。 自 法 
的 基本 思想 是 ， 设 置 并 逐步 扩充 一 个 集合 S， 存 放 已 求 出 其 最 短路 径 的 顶点 ， 则 尚未 确定 
最 短路 径 的 顶点 集合 是 V-S。 为 称呼 方便 ， 以 下 把 源 点 V 到 终点 w 的 最 短路 径 简称 为 顶点 
w 的 最 短路 径 , 集合 S 中 的 顶点 称 为 已 求 点 , 集合 V-S 中 的 项 点 称 为 符 求 点 。 算 法 开始 时 ， 
S 中 己 求 点 号 是 源 点 目 己 ， 以 后 每 一 步 加 是 按 最 短路 径 长 度 递 增 的 顺序 在 符 求 点 集合 中 选 
一 个 路 径 长 度 最 短 的 点 来 扩充 已 求 点 集 S， 直 到 所 有 顶点 都 成 为 已 求 点 。 

但 是 , 符 求 点 的 最 短路 径 长 度 本 里 就 是 竺 求 的 ,又 如 何 找 出 其 中 的 最 短 呢 ? 观察 表 6.2 
可 得 局 发 : 这 种 符 求 点 的 最 短路 径 上 ， 除 终点 外 ， 其 余 顶 点 都 是 已 求 点 。 于 是 ， 对 图 中 每 
一 顶点 1， 必 须 记 住 从 源 点 Y 到 1i、 且 中 间 只 经 过 已 求 点 的 最 短路 径 长 度 。 为 称呼 方便 ， 将 
此 长 度 称 为 顶点 1 的 距离 值 。 为 此 ， 定 义 一 个 数组 D[1..n] 来 存放 各 顶点 的 距离 值 。 

显然 ， 已 求 点 的 距离 值 就 是 该 点 的 最 短路 径 长 度 ， 而 符 求 点 的 距离 值 则 不 一 定 是 该 点 
的 最 短路 径 长 度 ， 因 为 从 源 点 到 该 竺 求 点 可 能 存在 经 过 其 他 竺 求 点 的 更 短路 径 。 但 可 以 证 
明 ， 奋 当前 符 求 点 中 距离 值 最 小 的 点 为 kx， 则 其 距离 值 D[k] 束 是 k 点 的 最 短路 径 长 度 ， 并 
且 k 也 是 竺 求 点 中 最 短路 径 长 度 最 短 的 顶点 。 如 图 6.20 所 示 ， 这 两 点 可 简单 地 证 明 如 下 : 

(1) 任 取 一 条 从 源 点 vv 到 点 的 路 径 Px， 该 路 径 可 能 经 过 各 干 符 求 点 ， 设 经 过 的 第 一 


第 © 章 吴 加 157 
MY 


个 待 求 点 为 x， 则 该 路 径 可 分 为 两 段 Px 和 Px， 于 是 : 
Pw 长度 >P,x 长 度 
>x 距离 值 (因为 Pyx 中 间 只 经 过 已 求 点 ， 而 距离 值 是 所 有 这 类 路 径 中 最 短 的 ) 
>k 距离 值 ( 因 为 k 点 是 所 有 符 求 点 中 距离 值 最 小 的 ) 
即 k 点 的 距离 值 就 是 k 点 的 最 短路 径 长 度 。 


(2) 对 任意 一 个 待 求 点 j， 任 取 一 条 从 源 点 v 到 顶点 j 的 路 径 Pw， 该 路 径 也 可 能 经 过 若 
干 符 求 点 ， 设 经 过 的 第 一 个 符 求 点 为 yY， 则 该 路 径 可 分 为 两 段 Pw 和 Pw， 于 是 与 (1) 类 似 ， 有 
P,; 长 度 >P。 长 度 
>y 距离 值 
>k 距离 值 


即 k 点 的 距离 值 也 是 所 有 竺 求 点 中 路 径 长 度 最 短 的 。 

由 上 面 两 点 ， 我 们 便 找到 了 扩充 已 求 点 集 S 的 方法 ， 即 每 一 步 在 当前 待 求 点 集中 选择 
一 个 距离 值 最 小 的 点 k 扩 充 到 S 中 。 此 时 ， 己 求 点 集 S 增加 了 一 个 点 k， 剩 下 的 等 求 点 的 
距离 值 可 能 发 生变 化 ( 即 减少 )， 因 为 这 时 增加 了 经 过 新 已 来 点 的 各 种 可 能 路 径 ， 所 以 必 
须 调 整 其 余 各 符 求 点 的 距离 值 。 

下 面 的 问题 是 如 何 调整 剩余 竺 求 点 的 距离 值 。 注 意 到 下 点 加 入 到 已 求 点 集 $ 后 ， 夺 东 
个 等 来 点 ] 的 距离 值 有 变化 ( 即 减少 )， 则 对 应 的 路 径 必 定 是 从 源 点 v 途经 k 最 后 到 达 竺 求 
点 ] 的 路 径 Pu。 由 于 Pu 中间 只 经 过 已 求 点 ， 它 的 前 一 段 Px 必定 是 的 最 短路 径 ， 其 长 
度 为 DIkK]; 它 的 后 一 段 Ps 只 有 两 种 可 能 :其 一 是 由 经 过 边 <k, > 直达 待 求 点 ]， 其 二 是 
从 出 发 再 经 过 大 干 已 来 点 后 到 达 ]。 但 后 一 种 情形 是 不 可 能 的 ， 如 图 6.21 所 示 ， 有 : 


ok 


待 求 点 
@ 入 
中 间 待 求 点 
6.20 路 径 Pwu 6.21 路 径 Pvog 


Puuj 长 度 =Pw 长 度 +Ple 长 度 +Pxj 长 度 
>k 距离 值 +Pke 长度 +Pxj 长度 
>x 距离 值 +Pis 长 度 +Pxj 长 度 〈 因 为 x 比 k 先 加 入 已 求 点 集 S， 其 距离 值 较 小 ) 
>x 距离 值 +Pxj 长 度 〈 因 为 Pe 长 度 >0) 
=P yx 长 度 
>] 距离 值 (因为 Pvxj 中间 只 经 过 已 求 点 ， 而 距离 值 是 所 有 这 类 路 径 中 最 短 的 ) 
即 这 种 情形 下 距离 值 不 可 能 减少 。 所 以 需要 按 第 一 种 情形 调整 距离 什 ， 即 对 符 求 点 集 
扫 朱 检查， 大菜 点 j 的 原 距 离 值 大 于 新 路 径 长 度 ， 即 D[k]+ 边 <k, j> 的 权 ， 则 将 DD 四 修改 为 
此 长 度 。 
上 述 算法 是 一 种 贫 心 算法 ， 它 每 次 都 从 竺 求 点 中 得 到 一 个 离 源 点 最 近 的 点 。 对 图 6.19 
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所 示 的 有 问 网 络 ， 按 该 算法 来 源 点 1 到 其 余 各 顶点 的 最 短路 径 的 过 程 ， 见 图 6.22。 图 中 阴 
影 圈 表 示 已 求 点 ， 其 他 为 符 求 点 ， 圆 圈 劳 的 数字 表示 该 点 当前 的 距离 值 ， 连 接 两 个 已 求 点 


(Ce) (f) 
图 6.22 Dijkstra 算法 求 源 点 1 到 其 余 各 顶点 的 最 短路 径 


开始 时 ， 已 求 点 集 S 只 有 一 个 源 点 1， 初 始 得 来 点 ] QJ=2,…, 5) 的 距离 值 DD] 即 有 回 
边 <1, j> 的 权 ， 见 子 图 (b)。 其 中 边 <1, 2> 和 <1, 3> 不 存在 ， 故 D[2]=co，D[3]=c， 可 见 待 求 
点 4 的 距离 值 D[4]=10 最 小 ， 它 就 是 源 点 1 到 顶点 4 的 最 短路 径 ， 将 顶点 4 加 入 已 求 点 集 
S。 此 时 ,每 求 点 3 有 一 条 新 路 径 Pss， 长 度 为 40， 小 于 原 距离 值 wo; 等 求 点 5 也 有 一 条 新 
路 径 Plas， 长 度 为 70, 小 于 原 距 离 值 90， 故 分 别 将 每 求 皮 3 和 5 的 距离 值 调 整 为 40 和 70; 
待 求 点 2 的 距离 值 不 变 ， 见 子 图 (c)。 类 似 进行 下 去 ， 可 依次 求 得 项 点 3, 5, 2 的 最 短路 径 
及 其 长 度 ， 如 子 图 (d)、(e) 和 (f) 所 示 。 

一 般 求 最 短路 径 长 度 时 ， 还 要 知道 具体 路 径 ， 为 此 可 设置 一 个 路 径 向 量 P[1..n]， 其 中 
P[] 表 示 工 点 的 最 短路 径 上 该 点 的 前 趋 项 点 。 这 样 可 根据 了 找到 路 径 上 每 个 顶点 的 前 趋 ， 从 
而 得 到 最 短路 径 。 设 有 问 网 络 以 邻接 窍 阵 存储 ， 有 具体 算法 如 下 : 

Vold dijkstra(mat graph *G,int v,int D[],int P[],char S[]) { 

/VV 为 源 点 ,D 为 距离 值 数组 ，P 为 路 径 前 趋 数组 ，s 为 已 求 点 标志 数组 。 所 有 数组 都 从 下 标 1 开始 使 用 


int i,],k,pre,min; 


Fa 二 // 初 始 化 距离 值 、 前 趋 、 已 求 点 集 
有 
D[1]=G->adjmat[v] [i]; 
P[I]=v; 
} 
S[v]=1;D[v]=0; // 将 源 点 V 放 入 5S 
for (i=1;1i<G—>n;1i++) { 
min=INT MAX; //INT_MAX 为 整数 最 大 值 ， 表 示 % 
=0: //k 记录 最 短 距离 值 点 (此 处 可 不 必 设 初 值 ) 
for (j=1;j<=G->n; j++) // 找 距离 值 最 小 的 待 求 点 
if(!S[j] && DIj]<min) { 
mln=D[]]:; 
k=]; 
} 


if (min==INT MAX) break:; / /剩余 点 距离 值 都 为 >， 不 必 调 整 距离 值 
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/从 


S[kK]=1; // 将 k 加 入 Ss 
for (J=1;]<=G->n;]J++) // 调 整 剩余 点 的 距离 值 和 前 趋 


lf(!S[]] &&DI]]>D[IKk]+G->ad]mat[k]l[]]) { 
D[]]=D[IKk]+G->ad]Jmat [k] []]:; 
4 
} 
} 
for (1=1;1i1<=G—>n;1i++) 1{ 
SouteenD[li le Wee 
pre=1; 
do { 
pre=P lprel]; 
cout<<"<—"<<pre; 
} while (pre!=v); 
if (D[i]==INT MAX) cout<<" (无 路 径 )" 
cout<<endl; 
} 
} 


注意 数组 从 下 标 1 开始 使 用 ， 所 以 有 关 的 C/C++ 语言 数组 在 定义 时 应 多 一 个 元 素 ， 如 
DIn+1]、P[lnt+1]、S[n+1] 等 ， 其 中 S 为 已 来 点 集 数组 ， 实 际 只 需 设置 一 个 已 来 标记 即 可 ， 
故 取 为 char 类 型 以 节省 空间 。 特 别 地 , 注意 到 图 G 邻接 矩阵 的 对 角 元 素 一 般 没 有 什么 作用 ， 
还 可 用 对 角 元 素 G->adjmat[il[i] 来 充当 S[j]。 

对 图 6.19 所 示 的 有 问 网 络 ， 硅 源 点 为 1， 则 算法 执行 过 程 中 D、P 等 的 变化 情况 如 表 
6.3 所 示 ， 其 中 阴影 部 分 为 已 求 出 的 最 短路 径 长 度 。 

表 6.3 算法 dijkstra 的 动态 执行 情况 
循环 | 已 求 点 “| k | Dl] | p[2] | os] | p[4] | pls] | PLD | P[2] | PI3] | P[4] | PIs] 
Wt | | ol>” ”lo 
1 oo- ol7l 1 1| 141011 
43 3 ol oil ll 
143553 | oo wl ll ll 
14352 |2 oS : | : | 4 | 1 


注意 ， 最 后 一 行 实 际 并 未 执行 (min=oo， 提 前 结束 )。 算 法 最 后 打印 输出 的 结果 为 : 
0: 1< 一 | 

m: 2<-1 (无 路 径 ) 

40: 3<-4<-1 

10: 4<-—1 

50: 5<-3<-4<-1 


> || I 
Lu | | 1 上 


显然 ， 知 输出 某 顶 点 的 最 短路 径 长 度 为 e， 则 从 源 点 到 该 顶点 没有 路 径 ， 而 源 点 到 目 
己 的 最 短路 径 长 度 是 0。 

容易 看 出 ， 算 法 dijkstra 的 时 间 复 杂 度 为 O(n”))， 占 用 的 辅助 空间 是 O(n)。 由 于 时 间 复 
杂 度 与 边 数 基本 无 关 ， 上 所 以 比较 适合 稠密 图 。 

上 述 算法 求 最 小 距离 值 的 时 间 还 可 以 减少 ， 即 不 对 所 有 竺 求 点 搜索 ， 而 采用 后 面 第 7 
章 将 介绍 的 小 根 堆 , 并 将 各 待 求 点 较 小 的 新 距离 值 添加 到 堆 中 再 重建 堆 (不 删除 原 距离 值 ， 
否则 处 理 困 难 )。 但 剩余 点 距离 值 调整 的 时 间 不 变 ， 所 以 算法 的 时 间 复 杂 度 仍 为 O(n7)。 
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6.6.2 ”所 有 顶点 对 之 间 的 最 短路 径 


所 有 顶点 对 (All-pairs) 之 间 的 最 短路 径 问 题 是 : 对 于 给 定 的 有 问 网 络 G=(V, E)， 要 
求 对 G 中 任意 两 个 不 同 的 顶点 v、w (vx#w)， 找 出 v 到 w 的 最 短路 径 。 

显然 ， 如 果 依 次 把 有 问 网 络 的 每 个 顶点 作为 源 点 ， 重 复 执 行 djkstra 算法 n 次 ， 就 可 
求 得 每 对 顶点 之 间 的 最 短路 径 ， 其 时 间 复 杂 度 为 Oo ) 。 对 此 问题 ，Floyd 在 1962 年 发 现 
了 一 个 更 为 直接 的 算法 ， 不 过 它 的 时 间 复 杂 度 也 是 O(n )。 

Floyd 算法 实质 上 是 一 种 欠 代 法 ， 它 在 图 的 邻接 矩阵 上 做 n 次 迭代 。 第 n 次 迭代 后 ， 
邻接 矩阵 上 第 1 行 第 j 列 的 元 素 值 即 为 1 到 j 的 最 短路 径 值 。 

为 了 便于 理解 Floyd 算法 ， 先 从 直观 上 进行 分 机 。 对 1&i, jsn， 奉 1 到 ] 有 边 ， 则 它 是 
1 到 j 的 一 条 路 径 ， 长 度 为 A[D]。 但 它 不 一 定 是 1 到 ] 的 最 短路 径 ， 因 为 可 能 存在 一 条 从 1 
到 j， 中 间 经 过 其 他 顶点 的 路 径 。 中 间 点 可 能 为 1, 2,…,n 中 的 一 个 或 多 个 ， 如 果 不 采 用 某 
种 方法 系统 地 进行 处 理 ， 势 必 太 烦琐 。Floyd 把 这 个 过 程 递 推 地 进行 ， 即 先 考虑 中 间 点 序 
号 不 大 于 的 情况 ， 然 后 考虑 中 间 上 点 序号 不 大 于 k+1 的 情况 ， 具 体 地 说 就 是 : 

(1) 首先 ， 考 虑 从 顶点 i 到] 是 否 有 中 间 点 序号 不 大 于 1 的 最 短路 径 。 这 一 步 实 际 上 
是 考虑 是 否 有 以 项 点 1 为 中 间 点 的 路 径 <i, 1,j>, 即 考虑 G 中 是 否 有 边 <i, 1> 和 <1, j>, 大 有 ， 
则 该 路 径 的 长 度 为 AD[1]+A[1]D]， 这 时 ， 比 较 路 径 <i, > 和 <i, 1, j> 的 长 度 ， 取 较 短 者 为 当 
前 最 短路 径 。 

(2) 其 次 ， 考 虑 从 顶点 i 到 j 是 否 有 中 间 点 序号 不 大 于 2 的 最 短路 径 。 即 是 否 有 路 径 
<i，…, 2,…, >， 在 没有 ， 则 当前 最 短路 径 不 变 ; 知 有 ， 则 该 路 径 长 度 为 路 径 <i，…, 2> 的 
长 度 + 路 人 径 <2,…, ]> 的 长 度 ， 而 这 两 条 路 径 就 是 前 一 步 求 出 的 中 间 点 序号 不 大 于 1 的 最 短 
路 径 。 将 新 的 路 径 长 度 和 原来 的 路 径 长 度 作 比较 ， 取 较 短 者 为 当前 最 短路 径 。 

(3) 然后 ， 再 考虑 从 顶点 1 到] 是否 有 中 间 点 序号 不 大 于 3 的 最 短路 径 。 依 次 类 推 ， 
直到 考虑 到 中 间 点 序号 不 大 于 nm 的 最 短路 径 后 ， 便 考虑 完了 中 间 点 为 任何 点 的 可 能 性 ， 故 
最 终 得 到 1 到 j 的 最 短路 径 。 

实现 上 述 算法 的 关键 ， 是 保留 每 一 步 求 得 的 所 有 顶点 对 之 间 的 当前 最 短路 径 长 度 。 为 
此 ， 我 们 需要 一 个 nxn 的 方 阵 序列 Aij[1..n][1..n] (i=0, 1,…, n) 来 保存 每 一 步 的 结果 ， 其 
中 Ak[ilD] 表 示 从 i 到 j 中 间 点 序号 不 大 于 kk 〈0<ks<n) 的 最 短路 径 长 度 。 

显然 ,Ao 就 是 G 的 邻接 矩阵 , 它 表 示 任 一 顶点 对 之 间 不 经 过 任何 中 间 点 的 最 短路 径 长 
度 。Floyd 算法 的 基本 思想 是 ， 从 Ao 开始 ， 递 推 地 产生 矩阵 序列 Al, Az，…, An。 

现在 假设 Ax_i 已 求 得 , 如 何 递 推 求 出 Ak 呢 ? 注意 到 在 第 k 步 , 对 于 任意 一 对 顶点 1,j， 
从 i 到 j 中 间 点 序号 不 大 于 k 的 最 短路 径 只 有 两 种 情况 : 


(1) 中 间 不 经 过 项 点 k， 那 么 有 : 

AkbDjDj=AxcaDjDj 

(2) 中 间 经 过 顶点 k， 则 该 路 径 由 两 段 路 径 <i，…,k> 和 <k，…,j> 组 成 ， 它 们 都 是 前 一 
步 求 出 的 中 间 结 点 序号 不 大 于 的 最 短路 径 ， 于 是 : 


AkDjDj=Aceabjlk+AcaikiDj 
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综合 上 面 的 结果 ， 可 得 Ak 的 递 推 公式 : 

AoljbDj=ADjDj 

AkbDjDj=anAxabDD Ar-ili[lk]l+Ar-i[k]ID]) lL =n js 

上 述 算法 需要 一 个 矩阵 序列 Ao, Al…, An， 但 实际 上 只 用 一 个 矩阵 就 可 ， 即 在 同一 个 
定 阵 中 进行 欠 代 。 这 是 因为 ， 在 第 次 欠 代 时 ，Akai[ilIk 和 Ai[kD] 的 值 不 变 。 以 Ak[i][] 
为 例 ， 它 表示 从 i 到 中间 点 序号 不 大 于 上 的 最 短路 径 。 该 路 径 上 如 果 不 含 顶 点 k， 则 路 
径 上 中 间 顶 点 的 序号 不 大 于 k=-1， 于 是 Axy[i[Ik]=Ax [i[k]; 如 果 含 有 顶点 k， 则 该 路 径 为 
<i，…, k,…, k>， 前 一 段 路 径 <i,，…, k> 的 长 度 仍 是 Api[[kK]， 后 一 段 路 径 <k,，…, k> 的 长 
度 非 负 ， 则 该 路 径 不 可 能 变 短 。 所 以 总 有 Ax[1[k]=Axi[[k]。 由 于 ADK] 和 A[k]0] 的 值 在 
当前 迭代 中 不 变 ， 于 是 计算 Ay 回 上 =Ax i[[K]+Ax [kKk]D] 时 便 可 在 同一 个 矩阵 中 进行 。 

为 了 得 到 最 短路 径 本 身 ， 设置 一 个 路 人 径 矩阵 path[1..n][1..n]， 它 也 是 迭代 产生 的 ， 其 作 
用 类 似 于 Dijkstra 算法 中 的 路 径 数 组 ， 但 这 里 pathx[il[j] 存 放 革 到 j 的 中 间 点 序号 不 大 于 kk 


的 最 短路 人 径 上 顶点 1 的 后 继 顶 点 (当然 也 可 存放 顶点 1 的 前 趋 项 点 )。 算 法 结束 时 , 由 path[i]D] 
即 可 找到 1 到 j 的 最 短路 径 上 的 各 个 顶点 。 
具体 算法 如 下 : 


void floyd (mat graph *G) {//A 为 最 短路 径 值 矩 阵 ，pPath 为 最 短路 径 窃 阵 ， 假 设 为 全 局 变量 
int 1,],k,next; 
for (1=1;1<=G—>n;1++) // 初 始 化 A 和 path 
for (]=17]<=G->n7y]++) { 
A[1i] [jl]=G->adjmat [i1] [J]]; 


path[i] [j]=j; //j 是 项 点 1 的 后 继 
} 
for (Kk=1; kK<=G—>n; k++) //n 次 迭代 


for (1=1;1<=G->ny I++) 
for (J=1;]j]<=G->n;]J++) 
if (A[i] [K]+A[K] [jl]<A[i][j]) { 


A[i] [jl]=A[i] [K] +A[K] [j]; / /修改 路 径 长 度 
path[i] [j]=path[i] [k]; // 修 改 路 径 后 继 
} 
for (i=1;i<=G->n; i++) // 输 出 所 有 顶点 对 之 间 的 最 短路 径 及 长 度 


for (j=1;j<=G->n;jJ++) { 
cout<<A[i] [j]<<": "<<i; ”// 输 出 路 径 长 度 


next=1; 

do { 
next=path [next] []j]; // 找 后 继 点 
cout<<"—->"<<next; // 输 出 后 继 顶 点 


} while (next!=]); 
if (A[i] [j]==INT MAX) cout<<" (无 路 人 径 )";//INT MAX 为 整数 最 大 值 ， 表 示 % 
cout<<endl; 
} 
} 


显然 该 算法 时 间 复 杂 度 为 O(n )， 比 较 适合 稠密 图 。 注 意 ， 算 法 中 有 关 数 组 下 标 从 1 
开始 使 用 (以 适应 从 1 开始 的 顶点 编号 所 以 在 定义 有 关 的 C/C++ 二 维 数组 时 应 多 一 行 一 
列 ， 如 迭代 矩阵 Afn+1][n+1] 和 路 径 和 矩阵 path[n+1][n+1]。 

以 图 6.19 所 示 的 有 向 网 络 为 例 ， 上 述 Floyd 算法 在 迭代 过 程 中 矩阵 A 和 path 的 变化 
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以 及 最 终结 果 如 下 : 

0 cx co 10 90 1] 2 3 4 5 
20 0 60 co oo 1] 2 3 4 5 

Aj=l|co co 0 co 10 path, = 1 2 3 4 5 
oo co 30 0 60 1] 2 3 4 5 
co oo co oo 0 1] 2 3 4 5 
0 co ~ 10 90 i344. 
20 0 60 30 110 1] 2 3 1 1 

Aij=l|ce ~ 0 10 path| =|1] 2 3 4 5 
co co 30 0 60 1] 2 3 4 5 
co 0 co oo 0 1] 2 3 4 5 

As=Al path,=pathi 
0 co co 10 90 1] 2 3 4 5 
20 0 60 30 70 AU JE 

A;=|co co 0 co 10 path; =|1] 2 3 4 5 
oo co 30 0 40 1 2 3 4 3 
co co co co 0 1] 2 3 4 5 
0 co 40 10 30 1] 2 4 4 4 
20 0 60 30 70 1] 2 3 1 3 

A,=|lco co 0 10 Pah 三 | > 了 4 3 
co eco 30 0 40 1] 2 3 4 3 
co oo co co 0 1] 2 3 4 5 

As=As paths=patha 

Os 一 >] 

%: 1->2 (无 路 径 ) 

40: 1->4->3 

10: 1->4 

一 

9 =»1 

(Us ZZ~=>2 

CU 2=>3 

30:; 2—>1->4 

Ue 2Z=% 

0: 35-—>5 


最 后 指出 ， 在 以 上 最 短路 径 问 题 中 ， 要 求 边 的 权 值 非 负 。 奋 边 的 权 值 可 正 可 负 ， 则 单 
源 路 径 的 Dijkstra 算法 不 再 有 效 〈 可 能 得 到 错误 结果 )， 需 采用 其 他 算法 ， 如 Bellman-Ford 
算法 〈 要 求 权 值 为 负 的 边 不 出 现在 某 个 回路 )， 而 所 有 点 对 路 径 的 Floyd 算法 仍 可 使 用 (也 
要 求 权 值 为 负 的 边 不 出 现在 茶 个 回路 )。 显 然 , 对 无 回 图 , 寿 可 把 每 条 边 拆 成 反问 的 两 条 有 
问 边 ， 则 前 述 算 法 也 可 适用 。 


67 有 向 无 环 图 及 其 应 用 


无 回路 的 有 问 图 称 为 有 向 无 环 图 (Directed Acyclic Graph，DAG)。 我 们 在 广义 表 中 ， 
就 曾 用 DAG 来 描述 有 共享 成 分 的 再 入 表 。 在 工程 应 用 上 ， 有 问 无 环 图 是 描述 一 项 工程 或 
系统 进行 过 程 的 有 效 工 具 。 本 区 介绍 这 方面 的 两 个 应 用 ， 它 们 对 应 这 样 的 两 个 问题 : 

(1) 整个 工程 能 售 顺利 进 行 ? 

(2) 完成 整个 工程 的 最 短 时 间 是 多 少 ? 哪些 活动 是 影 啊 整 个 工程 进度 的 关键 ? 


6.7.1 拓扑 排序 


在 现实 生活 中 ， 一 个 大 的 工程 〈Project) 沼 弟 可 分 成 大 干 较 小 的 子 工 程 ， 当 所 有 子 工程 
都 完成 时 ， 整 个 工程 也 就 完成 了 。 子 工程 侦 称 活动 (Activity)， 它 们 之 间 一 般 有 两 种 关系 : 
(1) 先后 关系 (依赖 关系 )， 一 个 活动 完成 后 ， 男 一 个 活动 才能 开始 。 
(2) 并 列 关 系 〈 独 立 关 系 )， 活 动 可 独立 、 并 行 地 进行 ， 互 不 影 啊 。 
如 何 安 排名 个 活动 的 先后 顺序 ， 使 各 个 活动 都 能 顺利 进行 呢 ? 这 类 有 关 工 程 进 度 、 次 
厅 规 划 之 类 的 问题 ， 都 可 归结 到 拓扑 排序 。 拓 扑 排 序 是 定义 在 有 问 图 上 的 一 种 操作 ， 目 的 
是 根据 顶点 间 的 关系 求 得 项 点 的 一 个 线性 排列 。 
例如 ， 假 设计 算 机 专业 的 学 生 要 学 完 表 6.4 所 列 出 的 课程 。 在 这 种 情况 下 ， 工 程 就 是 
完成 给 定 的 学 习 计划 ， 而 活动 束 是 学 习 一 门 课程 。 其中， 有 些 课程 是 基础 课 ， 不 需要 先 修 
其 他 课程 ， 如 《 噩 等 数学 》;， 男 一 些 课 程 则 必须 在 学 完 菜 些 先 修 课 程 后 才能 开始 学 习 ， 如 学 
习 《 数 据 结构 》 之 前 ， 必 须 先 学 完 《 局 级 语言 程序 设计 》。 
表 6.4 课程 进程 关系 
昌 下 肌 避 于 信 
C2 高 级 语言 程序 设计 一 
C3 数据 结构 cy? 
cs ce 
c a 
C7 Cl 
所 有 活动 之 间 的 关系 可 用 有 问 图 表示 : 顶点 表示 活动 ， 有 问 边 表示 活动 之 间 的 先后 关 
系 ， 即 如 果 有 边 <i,]>， 则 表示 活动 i 完成 后 活动 ] 才能 开始 。 图 6.23 的 有 问 图 就 表示 了 表 
6.4 中 各 课程 间 的 先后 关系 。 
一 般 地 ， 我 们 把 顶点 表示 活动 、 边 表示 活动 之 间 先 后 关系 的 有 问 图 ， 称 为 项 点 表示 活 
动 的 网 (Activity On Vertex network，AOV 网 )。 
对 于 一 个 有 加 图 ， 和 弟弟 要 将 它 的 所 有 顶点 排 成 一 个 线性 序列 Vi, v，…，va， 满 足下 述 
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关系 : 耕 图 中 从 顶点 vi 到 顶点 妆 有 路 径 ， 则 在 该 序列 中 vi 必须 排 在 vi 之 前 ， 否 则 vi 与 vi 
的 次 序 任意 。 这 种 序列 称 为 拓扑 序列 ， 构 造 拓扑 序列 的 操作 称 为 拓扑 排序 (Topological 
Sorting )。 

例如 ,对 图 6.23 所 示 的 有 问 图 进行 拓扑 排序 ,可 以 得 到 拓扑 序列 : cl, cz, C7, c6, C3, C4, C5 
和 cl cy, cz, C3, ce C4, Cs 等 《还 有 多 个 )。 如 果 一 个 学 生 每 个 学 期 只 能 修 读 一 门 课程 ,那么 该 
生 按 照 某 个 拓扑 序列 的 次 序 学 习 就 可 保证 任 一 课程 的 正常 学 习 ， 即 先 修 课 程 已 学 完 。 如 果 
每 学 期 需 修 多 门 课 ， 则 可 对 拓扑 序列 作 些 修改 ， 识 别 出 哪 些 课 可 同时 修 读 即 可 。 

一 般 情况 下 ， 假 设 有 问 图 代表 一 个 工程 计划 ， 知 条件 限制 只 能 串 行 工 作 ， 则 该 图 的 一 
个 拓扑 序列 就 是 整个 工程 得 以 顺利 完成 的 一 种 可 行 方 案 。 并 非 任何 有 问 图 的 项 点 都 可 以 排 
成 拓扑 序列 ， 若 图 中 存在 有 问 回路 时 就 没有 。 例 如 ， 图 6.24 的 有 向 图 中 存在 一 个 有 癌 回 路 
v3,， Ve, Vs， 其 中 任 一 顶点 都 有 路 径 到 达 男 外 两 个 项 点 ， 于 是 任 一 顶点 都 要 排 在 男 外 两 个 项 
点 之 前 ,这 是 不 可 能 的 。 通常 ,表示 某 项 实际 工程 计划 的 有 问 图 是 不 应 该 存在 有 问 回 路 的 ， 
因为 出 现 回 路 意味 着 : 某 些 活动 的 开工 将 以 自己 工作 的 完成 为 先决 条 件 ， 这 种 现象 称 为 死 
锁 ， 此 项 工程 是 不 可 行 的 。 
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SS 
A ob 
图 6.23 课程 间 的 先后 关系 图 6.24 有 向 图 的 死 锁 现象 
任何 DAG 的 顶点 都 可 以 排 成 一 个 拓扑 序列 ， 但 拓扑 序列 不 一 定 唯 一 。 例 如 ， 前 面 的 


例子 就 给 出 了 两 个 拓扑 序列 ， 而 且 还 可 以 构造 出 更 多 的 拓扑 序列 。 

拓扑 排序 的 基本 方法 是 简单 而 直观 的 ， 其 基本 步骤 如 下 : 

(1) 从 图 中 选择 一 个 入 度 为 0 的 顶点 且 输 出 之 。 

(2) 从 图 中 删 掉 些 项 点 及 其 所 有 出 边 。 

反复 执行 这 两 步 ， 直 全 所 有 顶点 都 已 输出 ， 此 时 整个 拓扑 排序 完成 ;或 者 直到 图 中 剩 
余 项 点 的 入 度 都 不 为 0 时 终止 ， 此 时 图 中 存在 回路 ， 拓 扑 排序 不 能 册 进 行 下 去 。 

以 图 6.23 为 例 ， 拓 扑 排序 过 程 如 图 6.25 (b) 一 图 6.25(g) 所 示 。 刚 开始 时 ，cy 和 c， 
的 入 度 为 0， 假设 先 输出 序号 较 大 的 ， 即 cx， 在 删除 c: 及 其 出 边 <cz, cs> 和 <c2, c4> 后 得 到 于 
图 (b)。 此 时 入 度 为 0 的 项 点 是 cd 和 cs。 假设 输出 c3， 删 除 其 出 边 <c3, cs> 和 <c3, cs>， 得 
到 子 图 (c)。 依 此 类 推 ， 直 人 至 得 到 子 图 (g) 之 后 ， 图 中 仅 有 一 个 入 上 度 为 0 的 项 点 cs， 输出 
后 整个 拓扑 排序 结束 。 最 后 得 到 的 拓扑 序列 是 : cz, C3, C4, C1, C7, c6, cs。 

下 面 以 邻接 表 作 存储 结构 , 讨论 拓扑 排序 算法 的 实现 。 为 了 便于 考察 每 个 项 点 的 入 度 ， 
在 顶点 表 中 增加 一 个 入 度 域 nm， 以 指示 当前 各 个 项 点 的 入 度 值 。 每 个 项 点 的 初始 入 度 值 可 
在 邻接 表 的 生成 过 程 中 累计 得 到 。 例 如 图 6.25 (a) 的 有 向 图 ， 其 邻接 表 如 图 6.26 所 示 。 
增加 入 上 度 域 后 的 项 点 表 如 下 : 


第 6 章 


(a) 初 态 (b) 输出 c 后 (c) 输出 c; 后 
© 
(d) 输出 cs 后 (e) 输出 ci 后 (f) 输出 cy 后 (g) 输出 cs 后 


6.25 ”拓扑 排序 过 程 


typedef struct 1{ 
datatype data; // 顶 点 信息 
int in; // 入 度 域 
pointer first; // 边 表 头 指针 
} headtype; // 顶 点 表 结 点 类 型 
在 算法 的 第 一 步 , 找 入 度 为 0 的 项 点 只 要 对 顶点 
表 的 入 度 域 扫描 即 可 。 为 了 避免 每 次 都 在 所 有 顶点 中 
重复 寻找 入 度 为 0 的 点 , 可 以 设置 一 个 栈 来 保存 当前 
所 有 人 入 上 度 为 0 的 点 ， 以 后 每 次 选 入 度 为 零 的 顶点 时 ， 
直接 从 栈 顶 取出 。 排 序 过 程 中 一 旦 出 现 新 的 入 度 为 0 
的 点 ， 怠 将 其 入 栈 。 在 拓扑 排序 之 前 ， 对 顶点 表 扫 描 
一 届 ， 将 所 有 初始 入 度 为 去 的 点 入 栈 。 
算法 的 第 二 步 , 是 删 去 已 输出 的 项 点 及 以 该 项 点 
为 起 点 的 出 边 , 其 目的 是 要 改变 这 些 出 边 上 终点 的 入 
度 。 因 此 ， 只 要 检 碍 从 栈 顶 弹出 的 点 《相当 于 删 去 此 
点 ) 的 出 边 表 , 把 每 条 出 边 的 终点 所 对 应 的 入 度 值 减 ”图 56.26 图 6.25(a) 带 入 度 域 的 邻接 表 
1 相当 于 删 去 出 边 )， 就 完成 了 第 二 步 操 作 。 
根据 上 面 的 叙述 ， 我 们 得 到 以 邻接 表 作 存储 结构 的 拓扑 排序 算法 ， 其 概要 摘 述 如 下 : 
void topsort (graph 9g) { 
扫描 顶点 表 ， 建 立 入 度 为 零 的 顶点 栈 ; 
while ( 栈 不 空 ) { 
弹出 栈 顶 v 并 输出 之 ; 
检查 v 的 出 边 表 ， 将 其 每 条 出 边 的 终点 w 的 入 度 减 1]， 者 变 为 零 ， 则 w 入 栈 ; 


data in first no next 


} 
大 输出 的 顶点 数 小 于 n， 则 输出 “有 回路 ”， 否 则 拓扑 排序 正常 结束 :; 
} 


下 面 给 出 求 精 后 的 拓扑 排序 算法 : 


如 


所 | 
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int topsort (lk graph *g) { 
lkstack S; // 假 设 采 用 链 栈 ( 结 点 数据 类 型 为 Int， 存 放 入 度 为 零 的 顶点 号 ) 
pointer p; 
int m,1i,v; 
init 1LKkstack(&S) ; 
for (1=1;1i<=g—->n;1i++) 
if(g->adjJlist[i] .In==0) push lkstack(&S,1); 
m=0; 
while(!empty lkstack (&S) { 
pop lkstack(&S,&v) ;cout<<v<<™ ™; 
m++> 
p=g—>ad]jlist[v] .first; 
while(p!=NULL) { // 将 点 的 各 出 边 的 终点 w 的 入 度 减 1， 若 变 为 零 ， 则 入 栈 
g—>ad]j]list[p->no] .in——; 
if(g->ad]jlist[p->no] .In==0) push lkstack(&S,p-—>no); 
p=p—>next; 
} 
} 
if (m<g->n) {cout<<" 图 中 有 环 ， 不 能 拓扑 排序 ! \n";return 0;} 
else return 1; 
} 


分 析 上 述 算法 ， 设 有 问 图 有 n 个 顶点 和 e 条 边 ， 建 立 初始 入 度 为 0 的 顶点 栈 ， 要 检查 
所 有 顶点 一 次 ， 执 行 时 间 为 O(n); 拓扑 排序 中 ， 关 有 回 图 无 回路 ， 则 每 个 项 点 入 、 出 栈 各 
一 次 ， 每 个 边 表 结 点 被 检查 一 次 ， 执 行 时 间 是 Oo+e)。 所 以 ， 总 的 时 间 复 杂 度 为 O(nte)。 

按 上 述 算法 和 图 6.26 的 邻接 表 ， 对 图 6.23 进行 拓扑 排序 的 过 程 正 是 图 6.25 (b) 一 
图 6.25(g) 所 示 的 过 程 。 如 刚 开始 时 cy 和 cz 的 入 度 为 0, 但 6c 后 入 栈 ， 所 以 先 输出 c>， 
删除 cs 及 其 出 边 后 cs 的 入 度 为 0，cs 入 栈 后 栈 项 为 ce， 所 以 它 又 比 ci 先 输 出 等 。 显 然 ， 邻 
接 表 不 同时 ， 拓 扑 序列 也 可 能 不 同 。 

值得 指出 的 是 ， 上 述 算 法 的 链 栈 可 不 必 使 用 额外 的 空间 ， 而 将 顶点 表 中 入 度 为 0 的 结 
点 作为 链 栈 的 结 点 ， 有 具体 就 是 将 这 些 顶 点 的 入 度 域 当 作 链 栈 的 next 链 指针 〈 下 标 值 )。 这 
是 因为 入 度 为 0 的 点 找到 后 ， 其 入 度 值 就 没 用 了 ,所 以 入 度 域 可 作 它 用 ,这 里 用 作 链 指针 ， 
从 而 形成 一 个 链表 ， 起 到 链 栈 的 作用 。 这 时 的 链 栈 是 一 个 静态 链表 。 进 一 步 ， 还 可 不 理会 
链 栈 的 结 点 域 ， 因 为 该 结 点 在 顶点 表 的 位 置 就 是 其 当前 位 置 ， 不 需要 由 结 点 域 来 指出 了 ， 
故 入 栈 时 只 需 修改 链 指 针 。 初 始 化 时 ， 栈 顶 指针 top 置 为 0， 再 对 顶点 表 扫 描 ， 每 找到 一 
个 初始 入 度 为 0 的 顶点， 就 将 该 点 入 栈 ， 入 栈 操作 是 令 其 next 指针 (in 域 ) 指 回 当前 的 栈 
顶 (top)， 然 后 将 top 指 癌 该 顶点 。 这 个 过 程 逻 辑 上 与 一 般 的 链 栈 是 一 致 的 ， 出 栈 亦 然 ， 
具体 就 不 细 述 了 。 

另外 ， 为 了 保存 当前 入 度 为 0 的 点 ， 也 可 以 不 用 栈 而 使 用 队列 ， 它 们 的 区 别 是 ， 入 度 
为 零 的 点 输出 的 时 机 不 同 : 用 栈 时 后 出 现 的 入 度 为 0 的 点 先 输出 ， 用 队列 时 则 后 输出 。 

对 上 述 方 法 适当 修改 ， 就 可 在 求 拓扑 序列 的 过 程 中 标识 出 可 并 行 的 活动 (顶点 )。 具 
体 做 法 是 ， 初 始 时 将 所 有 入 度 为 0 的 点 标 为 一 组 可 并 行 点 。 这 组 点 执行 完 步骤 (2) 后 ,将 
新 产生 的 入 度 为 0 的 点 标 为 新 的 一 组 可 并 行 点 ， 依 此 类 推 。 如 果 对 可 同时 进行 的 活动 的 数 
量 有 限制 ， 如 一 个 学 期 不 可 能 学 太 多 门 的 课程 ， 则 将 当前 并 行 组 中 多 出 来 的 点 并 到 下 一 组 
中 即 可 。 

以 上 算法 每 次 输出 的 是 入 度 为 0 的 点 ， 这 是 按 拓扑 排序 的 本 来 含义 进行 的 。 反 之 ， 如 
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宋 每 次 输出 的 是 出 度 为 0 的 点 ， 则 将 得 到 一 个 逆 回 的 拓扑 排序 。 这 种 算法 可 方便 地 在 逆 邻 
接 表 上 进行 : 对 每 个 结 点 ， 增 加 一 个 出 度 域 ， 每 次 输出 一 个 出 度 为 0 的 项 点 后 ， 将 其 入 边 
表 的 各 项 点 的 出 度 减 1; 为 避免 每 次 得 找 出 度 为 0 的 点 , 也 可 用 栈 或 队列 保存 当前 出 度 为 0 
的 点 。 这 些 过 程 与 上 述 算法 类 似 ， 故 具体 算法 从 略 。 

逆序 的 拓扑 排序 还 可 在 深度 优先 搜索 过 历 的 基础 上 进行 。 即 在 深度 优先 搜索 过 程 中 ， 
当 访 问 茶 顶点 时 先 不 输出 ， 而 将 它 存 入 茶 个 栈 ， 直 到 从 该 项 点 出 发 的 所 有 搜索 过 程 完 
最 后 回 退 到 该 点 时 ， 才 将 它 从 栈 中 弹出 并 输出 。 显 然 ， 最 先 退 栈 的 项 点， 其 出 度 为 0， 它 
是 拓扑 序列 的 最 后 一 个 项 点; 当 茶 个 顶点 Vi 退 栈 时 ， 以 它 为 起 点 的 边 的 终点 都 已 退 栈 ， 相 
当 于 vi 的 出 度 也 为 0。 所 以 这 样 得 到 的 顶点 序列 也 是 一 个 逆 癌 的 拓扑 序列 。 但 是 ， 不 论 有 
回 图 是 否 有 环 ，DFS 本 身 部 能 进行 表 历 ， 所 以 在 具体 实现 时 要 对 DFS 算法 进行 修改 ， 以 判 
断 有 问 图 是 否 有 环 ， 侍 则 可 能 得 到 一 个 假 的 拓扑 序列 。 

最 后 ， 我 们 应 该 认识 到 ， 拓 扑 排序 也 相当 于 是 对 有 加 图 的 一 种 过 历 。 


6.7.2 关键 路 径 


对 一 个 工程 问题 来 说 ， 除 了 关心 各 个 子 工 程 之 则 的 先后 关系 之 外 ， 通 常 更 关心 整个 工 
程 完 成 的 最 短 时 间 、 哪 些 活动 是 影响 整个 工程 进度 的 关键 等 问题 。 这 就 是 DAG 的 男 一 个 
应 用 一 一 描述 工程 进度 的 关键 路 径 问 题 。 在 描述 这 类 问题 的 有 癌 图 中 ， 顶 点 表示 事件 ， 边 
表示 活动 ， 边 上 的 权 表 示 活 动 持 续 的 时 间 ， 这 种 有 问 图 称 为 边 表示 活动 的 网 〈Activity On 
Edge network，AOE 网 )。 

在 AOE 网 中 ， 顶 点 所 表示 的 事件 实际 上 就 是 其 入 边 所 表示 的 活动 均 已 完成 、 其 出 边 
所 表示 的 活动 可 以 开始 的 这 样 一 种 状态 。 例 如 ， 图 6.27 所 示 的 AOE 网 包括 11 项 活动 ，9 
个 事件 (状态 )。 事 件 vi 表示 整个 工程 开始 ，vo 表示 整个 工程 结束 。 事 件 vs 表示 活动 ak 和 
as 已 经 完成 ， 活动 axg 和 asg 可 以 开始 这 种 状态 。 硅 权 表 示 的 时 间 单 位 是 天 ， 则 活动 al 需要 6 
天 完成 ，as 需要 4 天 完成 等 。 整 个 工程 一 开始 ， 活 动 aa、az、as 就 可 并 行 地 进行 ， 而 活动 
3a4、35、365 只 有 当 事 件 vvx>、vs、w 分 别 发 生 后 才能 进行 ， 当 活动 aio、all 完成 时 ， 整 个 工程 
也 就 完成 了 。 


图 6.27 AOE 网 示例 


表示 实际 工程 计划 的 AOE 网 应 该 是 无 回路 的 , 并 且 网 中 只 有 一 个 入 度 为 0 的 项 点 ( 称 
为 源 点 、 始 点 ， 表 示 工 程 开 始 ) 和 一 个 出 度 为 0 的 项 点 ( 称 为 汇 点 、 终 点 , 表示 工程 结束 )。 

1. 关键 路 径 和 关键 活动 

AOE 网 中 从 始点 到 终点 的 路 径 可 能 有 多 条 ， 其 中 有 些 活 动 可 以 并 行 地 进行 ,但 显然 只 
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有 各 路 径 上 的 所 有 活动 都 完成 后 ， 整 个 工程 才 算 完 成 。 所 以 ， 完 成 整个 工程 的 最 短 时 间 是 
从 源 点 Vi 到 终点 加 的 最 长 路 径 的 长 度 。 这 里 ， 路 径 长 度 是 路 径 上 各 边 的 权 值 之 和 。 从 源 
点 到 汇 点 的 最 长 路 径 称 为 关键 路 径 〈Critical Path )。 

显然 ， 关 键 路 径 决定 看 AOE 网 的 工期 ， 关 键 路 径 的 长 度 就 是 AOE 网 代表 的 工程 所 震 
的 最 短工 期 。 图 6.27 中 路 径 <vi, V2, Vs, Vs, ve> 隐 是 一 条 天 键 路 径 ， 长 度 为 18， 即 整个 工程 
全 少 要 18 天 才能 完成 。 一 个 AOE 网 的 关键 路 径 可 能 不 止 一 条 ， 如 路 径 <vi，Vz，Vs，V7，V9> 
也 是 图 6.27 的 一 条 关键 路 径 ， 它 的 长 度 也 是 18。 

为 了 寻找 和 分 析 关 键 路 径 ， 需 要 引入 几 个 时 间 概 念 。 

(1) 一 个 事件 vi 可 能 的 最 早 发 生 时 间 ved9， 是 从 源 点 到 到 顶点 全 的 最 长 路 径 长 度 。 
事件 发 生 后 ， 以 vi 为 起 点 的 各 出 边 < vs,vy > 所 表示 的 活动 a 才 可 以 开始 ， 即 这 些 活动 
ai 的 最 早 开 始 时 间 : 

e(1)=ve(k) 

例如 ， 图 6.27 中 事件 vs 的 最 早 发 生 时 间 是 7， 则 以 vs 为 起 点 的 两 条 出 边 所 表示 的 活 
动 ay 和 as 的 最 早 开始 时 间 也 是 7， 即 e(7)=e(8)=ve(5)=7。 

通常 将 源 点 事件 vi 的 最 早 发 生 时 间 定 义 为 0。 对 于 事件 w， 仅 当 其 所 有 前 趋 事件 vx 
均 已 发 生 、 且 所 有 入 边 <vx ve> 表 示 的 活动 均 已 完成 时 才 可 能 发 生 。 上 所 以 ve(k) 可 递 推 计算 : 

ve(l)=0 
bo? =max{ve(X)+ Wr} <V.,Vr >Eplkl,2< 和 kx<sn 

其 中 p[k] 表 示 所 有 以 Vi 为 终点 的 边 集 ，wy 表示 边 <vx, ve> 的 权 。 

(2) 在 不 拖延 整个 工期 的 条 件 下 , 一 个 事件 vi 允许 的 最 运 发 生 时 间 vl(k)， 应 该 等 于 终 
点 Vn 的 最 早 发 生 时 间 ve(n) 减 去 vi 到 va 的 最 长 路 径 长 上 度 。 事 件 Vi 发 生 时 ， 以 Vi 为 终点 的 
各 入 边 <vx, Vi 所 表示 的 活动 a; 均 已 完成 ， 即 这 些 活动 ai 的 最 述 完成 时 间 等 于 vl(k)。 由 于 
活动 ai 的 持续 时 间 是 Wxx， 所 以 活动 ai 的 最 人 运 开始 时 间 : 

1(1)=v1l(k)—Wxx 


间 。 显 然 事 件 vy 的 最 述 发 生 时 间 vl(o 不 得 迟 于 其 后 继 事件 v, 的 最 迟 发 生 时 间 v1(y) 与 活动 
<Vve vv> 的 持续 时 间 之 兰 。 所 以 VvI(k) 可 如 下 递 推 计算 : 

vl(n) = ve(n) 

vk)= mnitvl(y) — wi,} <Vivy >Es[k],1<k<n-l 

其 中 sg] 表示 所 有 以 we 为 起 点 的 边 集 ，wky 表 示 边 < ve,vy > 的 权 。 

(3) 时 间 差 10)-eG 表 示 完 成 活动 a 的 时 间 余 量 ， 也 就 是 在 不 拖延 整个 工期 的 条 件 下 ， 
该 活动 可 以 延迟 的 时 间 。 

右 时 间 余 量 为 去,， 即 10)=eQ)， 则 称 ai 为 关键 活动 ， 因 为 它 的 提前 或 延期 束 会 影响 整个 
工期 〈 提 前 或 延期 )。 显 然 ， 关 键 路 径 上 的 活动 都 是 关键 活动 。 对 非 天 键 活动 ， 它 的 提前 宛 
成 并 不 能 加 快 整个 工程 进度 ， 而 它 的 延期 上 只 要 不 超过 其 最 大 可 利用 时 间 ， 也 不 会 影 啊 整个 
工期 。 例 如 ， 对 图 6.27 中 事件 ae，e(6)=5，1(6)=8， 这 意味 着 即使 a6 推迟 3 天 也 不 会 延误 
整个 工程 的 进度 。 


条 ， 


2， 关 键 路 径 的 识别 
进行 关键 路 径 分 析 ， 目 的 是 寻找 合理 的 资源 ( 指 能 使 活动 进行 的 人 力 或 物力 调配 方 
使 AOE 网 代表 的 工程 尽快 完成 。 为 此 须 先 识 别 关键 路 径 。 只 有 缩短 关键 路 径 上 的 活 


动 (关键 活 动 ) 才 有 可 能 缩短 整个 工期 。 


由 前 述 可 知 ， 夺 把 所 有 活动 的 最 早 开 始 时 间 和 最 运 开 始 时 间 都 计算 出 来 ， 束 可 以 找 出 


所 有 的 关键 活动 ， 从 而 得 到 关键 路 径 。 以 图 6.27 为 例 ， 各 时 间 的 计算 结果 如 下 。 


Ea. 
里， 


(1) 各 事件 的 最 早 发 生 时 间 : 


ve (1)=0 

Ve (2)=Ve (1)+wi»2=0+6=6 

ve (3)=ve (1 上) +wW13=0+4=4 

ve (4)=Ve (1)+w1is=0+5=5 

ve (5)=max{ve (2) +w»s, Ve (3) +was}=max{6+1,4+1}=7 

Ve (6)=ve (4) +wae=5+2=7 

Ve (71)=ve (5)+ws7=/+9=16 

ve(8)=max{ve (5)+Wwse, Ve (6) +twes}=max{ /+/, 71+4}=14 
Ve(9)=max{vVve (7)+W7o, Ve (8) +Wweo}=max{16+2,14+4}=18 


个 难看 出 ， 上 述 计算 应 按 茶 一 拓扑 序列 的 次 序 进行 。 
(2) 各 事件 的 最 晚 发 生 时 间 : 


Vl1(9)=ve (9)=18 

V1 (8)=v1 (9)—wso=18-4=14 

V1l1(/)=v1 (9)—w7o=18-2=16 

v1 (6)=v1 (8) -wes=14-4=10 

Vl1(5)=min{vil (8)—wse, V1 (7)—ws7}=min{14-7,16-9}=7 

v1 (4)=v1 (6) -wss=10-2=8 

V1 (3)=v1 (5)—was=/—1=6 

V1 (2)=v1 (5)—w»s=/—1=6 

V1 (1)=min{vi (2) -wi2, V1 (3)—wi3, V1 (4) -wia}=min{6-6,6-4,8-5}=0 


显然 ， 上 述 计 算 应 按 某 一 拓扑 序列 的 逆序 进行 。 
根据 ve 和 Vi， 就 可 求 出 各 活动 的 最 早 开 始 时 间 e 人 和 最 迟 开始 时 间 1Q)， 以 及 时 间 余 
见 表 0.> 所 示 。 从 中 可 见 ， dl、 4d4、47、dgs、4d10 和 dll 是 关键 活动 ， 硅 将 图 | 中 所 有 


非 关 键 活动 删除 ， 则 得 到 网 6.28 实 线 所 示 的 关键 路 径 。 
表 6.5 图 6.27 所 示 AOE 网 的 计算 结果 


图 6.28 图 6.27 所 示 AOE 网 的 关键 路 径 
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由 前 面 的 讨论 可 以 得 出 求 关键 活动 算法 的 基本 步骤 : 


(1) 对 AOE 网 进行 拓扑 排序 ， 以 便 按 拓扑 序列 的 次 序 求 出 各 顶点 事件 的 最 早 发 生 时 
间 ve， 夺 图 中 有 回路 ， 则 算法 终止 ， 否 则 执行 步骤 (2)。 
(2) 按 拓 扑 序 列 的 逆 友 来 出 各 顶点 事件 的 最 述 发 生 时 间 vl。 


(3) 根据 各 顶点 的 ve 和 vl， 求 出 各 活动 的 最 早 开 始 时 间 eQi) 和 最 运 开 始 时 间 1G)。 寿 
e()=1(， 则 ai 为 关键 活动 。 
这 里 第 (2) 步 要 用 到 逆序 的 拓扑 序列 ， 所 以 在 第 (1) 步 中 要 保留 拓扑 排序 的 结果 。 


上 一 区 的 拓扑 排序 算法 不 能 直接 采用 , 因为 它 用 栈 保 存 入 度 为 0 的 项 点 , 排序 结束 后 栈 空 ， 
拓扑 序列 没有 保留 下 来 。 一 种 修改 方法 是 在 拓扑 排序 中 输出 各 顶点 时 ， 用 男 一 个 栈 将 之 保 


存 起 来 ， 排 序 结束 后 出 栈 就 可 得 到 所 需 的 逆序 拓扑 序列 ， 但 这 要 增加 O(n) 的 辅助 空间 。 
如 果 在 拓扑 排序 中 用 队列 保存 入 度 为 0 的 项 点， 并 注意 到 顺序 队列 出 队 时 原 队 列 元 素 

并 没有 被 真正 探 除 〈 参 见 图 3.8， 注 意 不 是 循环 队列 )， 则 在 拓扑 排序 结束 后 可 从 顺序 队列 

的 这 些 历 史 “ 狠 迹 ” 中 得 到 所 需 的 逆序 拓扑 序列 。 按 此 思想 ， 求 关键 活动 的 算法 如 下 : 


struct node { // 边 表 结 点 
int no; / /邻接 点 域 
int w; // 权 ( 边 长 ， 活 动 持续 时 间 ) 


pointer next; // 链 域 
}; 
int topsort (lk graph *g,sqqueue *S) { //S 为 顺序 队列 
//ve[] 为 项 点 最 早 发 生 时 间 (假设 为 全 局 量 ) 
pointer p; 
int m,i,v; 
for (i=1;i<=g->n;i++) ve[i]l=0; / /初始 化 项 点 最 早 发 生 时 间 
init sqqueue (&S); 
for (i1=1;1i<=g—>n;1++) 
if(g->adjlist[i].in==0) en sqqueue (&S,1); 
m=0; 
whlle (!empty sqqueue (&S)) { 
de sqqueue (&S, &v); 
m++; 
p=g—>adjJlist[v] .first; 
while (p!=NULL) { // 将 点 的 各 出 边 的 终点 w 的 入 度 减 1]， 者 变 为 零 ， 则 入 队 
g—>ad]jlist[p->no] .in——; 
i1f(g->ad]jlist[p->no] .In==0) en sqqueue (&S,p->no); 
if(ve[v]+p->w>ve[p->no]) ve[p->no]=ve[v]+p->w;// 顶 点 最 早 发 生 时 间 
p=p—>next; 
} 
} 
if (m<g->n) {cout<<" 图 中 有 环 ， 不 能 拓扑 排序 ! \n";return 0;} 
else return 1; 
} 
int criticalpath (lk graph *g) { 
//vVe[],V1[] 为 项 点 最 早 、 最 述 发 生 时 间 (假设 为 全 局 量 ) 
pointer p; 
int m,i,v,e,1; 
sqqueue S:; /VS 为 顺序 队列 
if(!topsort(g,&S)) {cout<<" 图 中 有 环 ， 没 有 关键 路 径 ! \n";return 0;} 
for (i=1;i<=g—>n;i++) vl[i]=ve[n]; // 初 始 化 顶点 最 迟 发 生 时 间 


for (i=g—>n—1;i>=1;i-—) { // 按 拓扑 序列 逆序 取 顶 点 
v=S [1]; 
p=g—>adjlist[v] .first; 
while(p!=NULL) { 
if (vl[p->no]-p->w<vl[v]) vl[Vv]=vl[p->no]-p->w;// 顶 反 最 述 发 生 时 间 
p=p—>next; 
} 
} 
m=0; // 边 (活动 ) 计数 器 
for(1=171< 0 >n7114) { // 依 次 取 各 顶点 
p=g—->adjlist[1i] .first; 
while(p!'=NULL) { 
m 二 十 ; 
e=ve [1]; 
1=Vv1 [p—->no] -p>w; 
cout<<m<<" "<<g->ad]jlist[i] .data<<™" "<<g->ad]jlist[p->no] .data<<™ " 
ue TReLee™ ee l= Gs 
if (1==e) cout<<" 关 键 活动 "; 
GE” AD > 
p=p—>next; 
} 


} 
return 1; 


} 


显然 ， 上 述 算法 的 时 间 复 杂 度 为 O(nt+e)。 

需要 指出 ,缩短 关键 活动 的 时 间 并 非 一 定 能 缩短 工期 ; 即使 能 缩短 也 不 一 定 是 等 量 的 。 
因为 工期 由 当前 最 长 路 径 决定 ， 若 原 关 键 路 径 缩 短 后 还 是 当前 的 最 长 路 径 ， 则 工期 会 等 量 
地 缩短 ; 名 原来 有 多 条 关键 路 径 ， 其 中 一 条 缩短 而 其 他 未 变 ， 则 工期 不 变 ; 大 出 现 新 的 最 
长 路 径 ， 因 它 肯定 比 原来 的 关键 路 径 短 ， 故 工期 会 缩短 ， 但 少 于 原 关 键 路 径 的 缩短 量 。 

例如 ， 若 把 图 6.28 中 的 关键 活动 ail 由 4 天 缩短 为 3 天 ， 则 工期 并 不 变 ， 因 为 另 一 条 
关键 路 径 <V1, V2, Vs, V7, ve> 的 长 度 未 变 〈 还 是 18 天 )。 寿 把 al 由 6 天 纵 短 为 4 天 ， 则 原 关 
键 路 径 还 是 当前 最 长 的 ， 工 期 便 可 提前 2 天 。 但 车 把 ai 由 6 天 缩短 为 3 天 ， 则 原 关 键 路 径 
就 不 是 当前 最 长 的 了 ， 新 关键 路 径 <vi, V3, Vs, V7( 或 V8), ve> 的 长 度 为 16 天 ， 即 工期 只 能 提 
前 2 天 。 

一 般 地 ， 知 原来 只 有 一 条 关键 路 径 ， 加 快 其 中 任 一 活动 ， 或 者 原来 有 多 条 关键 路 径 ， 
加 快 公共 路 径 上 的 活动 ， 都 可 缩短 工期 ， 但 不 一 定 是 等 量 的 。 


6.1] (1) 某 图 有 n 个 顶点 ， 则 顶点 的 上 度 最 大 可 能 为 多 少 ? 度 为 奇数 的 点 可 能 是 奇数 
个 吗 ? 
(2) 某 无 向 图 所 有 顶点 的 度 都 >2， 能 否 肯 定 它 一 定 有 回路 ? 
6.2 (1) 某 无 同 图 有 25 条 边 ， 则 该 图 至 少 几 个 顶点 ? 
(2) 某 无 问 图 有 10 个 顶点 ，5$ 条 边 ， 则 该 图 的 连通 分 量 最 多 几 个 ? 最 少 几 个 ? 
6.3 (1) 某 无 问 图 有 mn 个 顶点 ，e 条 边 (n>e)， 晶 是 一 个 森林 ， 则 它 有 多 少 棵 树 ? 
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(2) 某 无 加 图 有 nn 个 项 点 ，m 个 连通 分 量 ， 则 其 生成 森林 中 有 几 条 边 ? 
6.4 (1) 茶 图 的 邻接 矩阵 是 对 角 线 以 下 为 去 的 上 三 角 和 矩阵 ， 则 该 图 能 人 否 进 行 拓 扑 
排序 ? 
(2) 硅 某 图 可 以 拓扑 排序 ， 则 能 否 对 顶点 重新 编写 使 邻接 矩阵 是 对 角 线 以 下 为 零 
的 上 三 角 算 阵 ? 
6.5 ”怎样 判断 一 个 有 问 图 是 否 有 回路 ? 
6.6 车 对 有 问 图 经 常 要 DFS 遍历 、BFS 遍历 ， 求 邻 点 、 求 顶点 的 度 ， 则 采用 邻接 算 
阵 表 示 和 邻接 表 表 示 哪 个 更 好 ? 
6.7 画 出 图 6.29 的 邻接 和 矩阵、 邻接 表 、 首 邻接 表 、 强 连通 分 量 。 
6.8 已 知 某 无 问 图 有 6 个 顶点 ， 现 依次 输入 各 边 (vl, V2)、 (Vz, Ve)、(V2, V3)、(V3, Ve)、 (Vso, 
V4)、(V6e, va)、(v4, Vs)、(Vs, v1)， 采 用 头 插 法 建立 邻接 表 ， 试 画 出 邻接 表 ， 并 写 出 在 此 基础 


上 从 顶点 到 出 发 的 DFS 和 BFS 遍历 序列 。 
6.9 ”怎样 求 有 向 图 的 强 连通 分 量 ? 
6.10” 对 图 6.30 用 Dijkstra 算法 求 源 点 vi 到 其 余 各 顶点 的 最 短路 径 。 
6.11” 对 图 6.31 用 Floyd 算法 求 所 有 顶点 对 之 间 的 最 短路 径 ， 写 出 迭代 过 程 和 结果 。 
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图 6.29 图 6.30 图 6.31 


6.12” 若 上 题 的 每 个 顶点 表示 一 个 村 庄 ， 边 上 的 数字 表示 从 一 个 村 庄 到 另 一 个 所 花费 
的 时 间 。 现 要 在 其 中 之 一 建 俱 乐 部 ， 请 问 : 

(1) 大 要 求 其 他 村 庄 到 俱乐部 的 距离 都 较 近 ， 则 选 哪个 较 好 ”? 

(2) 在 要 求 俱乐部 到 其 他 村 庄 的 距离 都 较 近 ， 则 选 哪个 较 好 ? 

(3) 大 要 求 其 他 村 庄 到 俱乐部 的 距离 总 和 最 小 ， 则 选 哪个 较 好 ? 

(4) 大 要 求 俱 乐 部 到 其 他 村 庄 的 距离 总 和 最 小 ， 则 选 哪个 较 好 ? 

6.13” 男 出 图 6.32 帘 入 度 域 的 邻接 表 ， 假 设 邻 接 表 的 结 点 按 结 点 序号 递增 排列 。 分 别 
用 栈 和 队列 保存 拓扑 排序 中 入 度 为 零 的 点 ， 写 出 相应 的 拓扑 排序 序列 。 

6.14 求 图 6.33 的 关键 路 径 。 
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6.15 ”编写 算法 ， 根 据 输入 的 顶点 和 边 建立 有 向 图 的 逆 邻 接 表 。 
6.16 编写 算法 ， 由 无 向 图 的 邻接 矩阵 生成 邻接 表 ， 要 求 邻 点 表 中 的 结 点 按 顶 点 序号 
的 大 小 顺序 排列 。 


6.17 试 写 出 深度 优先 遍历 的 非 北 归 算法 。 

6.18 ”编写 算法 ， 实 现 以 下 功能 : 

(1) 判断 有 向 图 中 是 否 有 从 顶点 vi 到 vi 的 简单 路 径 (1 为 )， 若 有 则 输出 该 路 径 。 
(2) 判断 有 加 图 中 是 否 有 包含 所 有 顶点 的 简单 路 径 。 

6.19 ”编写 算法 ， 实 现 以 下 功能 : 

(1) 判断 有 问 赂 中 是 否 有 从 顶点 v 出 发 的 简单 回路 ， 知 有 则 输出 该 回路 。 

(2) 判断 有 加 图 中 是 否 有 包含 所 有 顶点 的 简单 回路 。 

6.20 编写 算法 ， 实 现 以 下 功能 : 

(1) 求 有 问 图 中 距离 项 点 v 的 最 短路 径 长 度 为 len 的 所 有 顶点 。 

(2) 求 有 问 图 中 距离 顶点 v 的 最 短路 径 长 度 最 大 的 所 有 顶点 。 
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排序 是 数据 处 理 中 经 党 使 用 的 一 种 重要 运 算 。 在 当今 的 计算 机 系统 中 ， 花 费 在 排序 上 
的 时 间 占 系统 CPU 运行 时 间 的 很 大 比重 。 如 何 进行 排序 , 特别 是 如 何 蜗 效 地 进行 排序 是 计 
算 机 应 用 中 的 重要 读 题 之 一 ， 人 们 已 经 研究 出 了 各 种 各 样 的 排序 方法 ， 并 且 还 在 不 断 地 研 
究 和 发 展 中 。 

本 章 介 绍 排序 的 一 些 基 本 概念 和 内 部 排序 方法 中 几 个 比较 经 典 的 方法 ， 最 后 对 外 部 排 
序 作 了 简单 介绍 。 认 真 学 习 和 领会 各 种 排序 方法 所 包含 的 思想 和 技巧 对 提高 程序 设计 能 
也 是 非 第 有 益 的 。 


.个 基本 概念 


排序 的 例子 在 日 党 生活 中 是 比较 常见 的 ， 例 如 ， 电 话 号 人 码 竹 、 图 书馆 书目 、 词 典 、 仓 
库 清音 等， 一般 都 被 整理 得 井井有条 ， 这 个 整理 的 过 程 就 是 排序 。 排 序 的 目的 主要 是 为 了 
便于 以 后 查找 ， 从 而 提高 工作 效率 。 

在 本 章 中 ， 我 们 将 被 排序 的 对 象 即 数据 元 素 一 般 称 为 记录 。 记 录 一 般 由 硅 干 个 数据 项 
(又 称 作 域 ) 组 成 ， 其 中 可 用 来 标识 一 个 记录 的 数据 项 或 其 组 合 ， 称 为 关键 字 〈Key)， 人 和 何 
称 键 。 该 数据 项 的 值 称 为 键 值 。 注 意 ， 关 键 字 可 为 一 个 以 上 数据 项 的 组 合 ， 但 本 章 只 考虑 
仅 含 一 个 数据 项 的 关键 字 。 关 键 字 可 用 作 排 序 的 依据 ， 它 一 般 为 数值 型 或 字符 串 。 有 原则 上 
任何 数据 项 都 可 作 关 键 字 ， 但 有 些 关 键 字 可 唯一 地 标识 一 个 记录 ， 即 不 同 记 录 该 数据 项 的 
值 不 同 ， 这 种 关键 字 称 为 主 关键 字 (Primary Key); 相应 地 ， 其 他 不 能 唯一 地 标识 一 个 记 
录 的 关键 字 称 为 次 关键 字 (Secondary Key )。 

选取 记录 中 的 哪 一 项 作 关 键 字 ， 要 根据 问题 的 具体 要 求 而 定 。 例 如 ， 假 设 学 生成 绩 表 
中 有 学 号 、 姓 名 、 数 学 、 物 理 、 化 学 、 英 语 等 内 容 ， 每 个 学 生 的 信息 是 一 个 记录 ， 帮 要 唯 
一 地 标识 一 个 记录 ， 可 用 “学 号 ” 作 关 键 字 ， 奋 要 按 数 学 成 绩 排 名 次 ， 则 需 用 “数学 ” 作 
关键 字 。 

排序 (Sorting)〉 就 是 将 一 组 任意 排列 的 数据 元 素 进 行 整 理 ， 使 之 重新 排列 成 一 个 按 关 
键 字 递增 或 递减 的 序列 。 或 者 确切 地 说 ， 排 序 是 这 样 的 一 种 运算 ， 它 将 含有 nn 个 记录 的 集 
合 {R;，R2，…，Ra} ， 重 新 排列 成 一 个 序列 {Ri，Rip，…，Ria} ， 使 得 相应 的 键 值 满足 Ji 到 
ky 三 … 三 k;,。 (升序 ) 或 ki 三 ky 宇 … 宇 ki;, (降序 )。 

注意 ， 这 里 的 比较 运算 “三 “或 ”三 ”， 不 一 定 是 数值 比较 ， 也 可 以 是 学 符 串 比较 ， 


第 7 章 “ 排 序 sy 


其 至 是 用 户 自 定 义 类 型 的 比较 (在 C+ 中 可 重 载 比较 运算 符 )。 

显然 ， 当 数据 表 中 各 记录 键 值 均 不 相同 时 ， 排 序 的 结果 是 唯一 的 ， 否 则 结 末 不 唯一 。 
如 果 多 个 键 值 相 同 的 记录 ， 排 序 后 相对 次 序 总 能 保持 不 变 ， 则 称 这 种 排序 方法 是 稳定 的 ; 
否则 称 为 不 稳定 的 。 注 意 ， 稳 定性 是 算法 本 喘 的 特性 ， 有 “稳定 ” 则 对 所 有 情况 都 成 立 ; 
石 “不 稳定”， 只 要 举 出 一 个 反例 即 可 。 

对 多 关键 字 情 况 ， 还 会 涉及 多 关键 字 排 序 (多 键 排 序 ) 问题 ， 即 先 按 第 一 关键 字 排 序 ; 
各 第 一 关键 字 相同 ， 则 按 第 二 关键 字 排 序 ， 奋 第 二 关键 字 也 相同 ， 再 按 第 三 关键 字 排 序 ; 
其 余 类 推 。 多 天 键 字 排序 的 实现 一 般 有 两 种 方式 〈 设 第 1 到 第 d 个 关键 字 分 别 为 ki, kz2, …， 
ka)。 

依次 对 记录 进行 d 次 排序 。 具 体 实 现时 又 有 两 种 方式 : 

(1) 第 一 次 按 ki 排序 ， 得 到 才干 子 序 列 ， 每 个 子 序列 中 ki 相同 ;然后 对 每 个 子 序列 
按 ks 排序 ， 得 到 奎 干 更 小 的 子 序 列 ， 册 对 每 个 子 序列 按 ks 排序 ，……… ， 最 后 对 每 个 子 序 
列 按 ka 排序 。 这 种 方法 称 为 最 高 位 优先 (Most Significant Digit First，MSD) 法 。 

(2) 第 一 次 按 ka 排序 ， 第 二 次 按 ka_ 排序 ……， 最 后 按 ki 排序 。 这 种 方法 称 为 最 低位 
优先 (Least Significant Digit First，LSD) 法 。 它 每 次 不 必 将 序列 逐 层 分 割 成 各 和 干 子 序列 后 
册 分 别 排序 ， 而 是 整体 重 排 ， 比 较 方 便 。 

方法 二 : 

将 关键 字 ki k2…, ka 分 别 视 为 字符 串 ， 将 它们 依次 首尾 连接 在 一 起 ， 形 成 一 个 大 字符 
串 ， 然 后 ， 对 数据 表 按 此 字符 串 排序 。 

显然 ， 不 论 哪 种 方法 ， 多 关键 字 排 序 问题 都 转化 成 了 单 天 键 字 排序 ， 所 以 ， 本 章 我 们 
只 讨论 单 关 键 字 排序 的 情况 。 

根据 排序 过 程 涉及 的 存储 设备 的 不 同 ， 排 序 可 分 为 以 下 2 种 : 

(1) 内 排序 (Internal Sorting)。 排 序 过 程 中 ， 数 据 全 部 都 存放 在 内 存 中 进行 处 理 ， 不 
涉及 数据 的 内 外 存 交 换 。 

(2) 外 排序 “External Sorting)。 排 序 过 程 中 要 进行 数据 的 内 外 存 交 换 。 

内 排序 适用 于 数据 量 小 、 记 录 个 数 不 多 的 情形 ;外 排序 则 针对 数据 量 大 、 不 能 一 次 全 
部 效 入 内 存 的 情形 ， 这 时 数据 的 主要 部 分 存放 在 外 存 中 ， 通 过 数据 的 内 外 存 交 换 ， 售 助 内 
存 巡 步调 整 记录 之 间 的 相对 位 置 。 本 章 先 讨论 内 部 排序 ， 最 后 简单 介绍 一 下 外 部 排序 。 

内 排序 的 方法 很 多 ， 按 排序 所 用 策略 的 不 同 ， 大 任 可 分 为 五 类 : 插入 排序 、 选 择 排序 、 
交换 排序 、 归 并 排序 和 分 配 排序 。 但 从 排序 过 程 中 整个 数据 表 呈 现 的 总 体 变 化 趋势 上 看 ， 
这 些 排序 方法 也 可 分 成 如 下 两 类 : 

(1) 有 序 区 增长 法 。 将 数据 表 分 成 有 序 区 和 无 序 区 ， 随 大 排序 过 程 的 进行 ， 有 序 区 逐 
渐 增 长 ， 无 序 区 逐渐 缩小 ， 最 后 全 部 为 有 序 区 。 根 据 具体 算法 的 不 同 ， 初 始 有 序 区 为 空 或 
仅 含 一 个 元 素 ( 一 条 记录 总 是 有 序 的 )。 

(2) 有 序 度 增长 法 。 数 据 表 不 能 分 成 明显 的 有 序 区 和 无 序 区 ， 但 排序 过 程 的 每 一 步 ， 
整个 数据 表 的 有 序 程 度 都 提 融 一 点 ， 最 后 变 得 完全 有 序 。 

要 在 众多 的 排序 法 中 ， 和 年 单 地 判断 哪 一 种 算法 最 好 ， 以 便 能 普遍 选用 是 困难 的 。 一 般 
评价 排序 算法 好 坏 的 标准 主要 有 两 条 : 一 是 算法 执行 所 需要 的 时 间 ; 二 是 算法 执行 所 需要 
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的 附加 空间 。 另 外 ， 算 法 的 稳定 性 、 复 杂 程 度 等 也 是 利 考 虑 的 因素 。 由 于 排序 算法 所 需 的 
附加 空间 一 般 都 不 大 ， 了 矛盾 并 不 突出 ， 而 排序 是 经 党 执行 的 一 种 运算 ， 往 往 属于 系统 的 核 
心 部 分 ， 所 以 排序 的 时 间 开 销 是 算法 好 坏 的 最 重要 的 标志 。 

在 排序 过 程 中 ， 一 般 要 进行 下 列 两 种 基本 操作 : 比较 关键 字 的 大 小 ， 将 记录 从 一 个 位 
置 移动 到 另 一 个 位 置 。 所 以 ， 排 序 的 时 间 开 销 主要 是 指 算法 执行 中 关键 字 的 比较 次 数 和 记 
录 的 移动 次 数 。 当 键 值 是 字 串 时 ， 比 较 要 占用 较 多 的 时 间 ,， 是 影响 时 间 复 杂 上 度 的 主要 因素 ; 
而 当 记 录 本 里 的 数据 量 很 大 时 ， 为 了 交换 记录 的 位 置 ， 移 动 记录 也 要 占用 较 多 的 时 间 ， 是 
影响 时 间 复 杂 度 的 男 一 个 主要 因素 。 因 此 ， 在 下 和 面 讨论 各 种 内 部 排序 算法 时 ， 我 们 将 主要 
给 出 各 算法 中 记录 的 比较 次 数 及 移动 次 数 。 

在 排序 的 两 个 基本 操作 中 ， 比 较 操 作对 大 多 数 排序 方法 来 说 都 是 必要 的 ， 但 移动 操作 
可 通过 改变 数据 表 的 存储 方式 来 避免 。 数 据 表 的 存储 方式 向 用 的 有 3 种 : 

(1) 顺序 存储 方式 。 将 数据 表 的 各 记录 按 其 在 数据 表 中 出 现 的 先后 顺序 依次 存放 到 一 
组 连续 的 内 存单 元 中 ( 即 以 一 维 数组 作为 存储 结构 ), 在 排序 过 程 中 对 记录 本 喘 进 行 物理 重 
排 ， 即 通过 比较 和 判定 ， 把 记录 移 到 合适 的 位 置 。 

(2) 链 式 存储 方式 。 将 数据 表 组 织 成 链表 (动态 链表 或 静态 链表 )， 排 序 过 程 中 无 须 
移动 记录 ， 仪 需 修改 指针 即 可 。 通 常 把 这 类 排序 称 为 ( 链 ) 表 排 序 。 

(3) 索引 顺序 存储 方式 。 数 据 表 本 喘 按 顺序 存储 方式 存储 ， 但 另外 建立 一 个 关键 字 和 
对 应 存储 位 置 的 索引 表 ， 在 排序 时 只 对 索引 表 进 行 物 理 重 排 而 不 移动 原始 记录 本 映 。 它 可 
避免 一 般 顺 序 存储 方式 中 记录 的 移动 问题 。 

为 了 简单 起 见 ， 本 章 以 数组 作为 数据 表 的 存储 结构 ， 并 假设 关键 字 是 整 型 〈 实 际 中 还 
可 为 实 型 、 字 符 和 字符 串 等 )。 数 据 表 定 义 如 下 : 

const int maxsize=100; // 数 据 表 容量 ， 假 设 为 100 


typedef int datatype; 
typedef struct { 


datatype key; // 关 键 字 域 
othertype other; // 其 他 域 (根据 实际 情况 设置 或 取消 ) 
} rectype; // 记 录 类 型 


typedef rectype list[maxsize+1];// 数 据 表 类 型 ，0 号 单元 不 用 


由 于 C/C++ 语言 数组 下 标 从 0 开始 ， 而 记录 序号 一 般 从 1 开始 ,为 使 二 者 一 致 , 将 list 
类 型 变量 的 第 0 号 单元 空闲 ， 不 存放 记录 ， 但 可 用 作 其 他 用 途 ， 如 “监视 哨 ”。 

若 无 特 别 声 明 ， 本 章 以 下 均 按 升序 讨论 排序 ， 并 在 无 上 疏 义 的 情况 下 ， 将 记录 键 值 的 大 
小 简称 为 记录 的 大 小 ;记录 键 值 的 比较 ， 简 称 为 记录 的 比较 。 


& 2， 插入 排序 


插入 排序 的 基本 思想 是 : 每 次 将 一 个 待 排序 的 记录 ， 按 大 小 插入 到 已 排 好 的 有 序 区 适 
当 位 置 ， 直 到 全 部 记录 插入 完毕 为 止 。 这 类 似 于 玩 纸 牌 时 一 边 抓 牌 一 边 理 牌 的 过 程 : 每 抓 
一 张 脾 就 将 它 插 到 正确 的 位 置 上 。 本 市 介绍 直接 插入 排序 和 希 尔 排序 。 
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7.2.1 直接 插入 排序 


直接 插入 排序 (Straight Insertion Sort) 是 一 种 最 简单 的 排序 方法 ， 它 的 基本 思想 是 ， 
在 排序 过 程 中 , 每 次 都 将 无 序 区 中 第 1 条 记录 插入 到 有 序 区 中 适当 位 置 , 使 其 仍 保持 有 序 。 
初始 时 ， 取 第 1 条 记录 为 有 序 区 ， 其 他 记录 为 无 序 区 。 随 看 排序 过 程 的 进行 ， 有 序 区 不 断 
扩大 ， 无 序 区 不 断 缩小 。 最 终 无 序 区 为 空 ， 有 序 区 包含 了 全 部 记录 ， 排 序 结束 。 
以 数据 表 (49, 38, 49' 91, 27, 03, 97, 49") 为 例 ， 直 接 插入 排序 过 程 如 图 7.1 所 示 。 其 
中 相同 的 关键 字 49 加 撤 区 分 ， 方 插 号 表示 当前 的 有 序 区 ; 虚线 表示 下 一 趟 要 插入 的 位 置 。 
RI1] RI2] RI[I3] RI4] RI5] RI6] RIT7] Rsl 
初始 : [49] 49' 91 27 03 97 49" 


-_- 
ems 


第 1 趟 后 : [38 49] 49' 91 27 03 97 49" 
第 2 趟 后 [38 49 49] 91 27 03 97 49" 
hh |! 


第 3 趟 后 : [38 49 49' 91] 27 03 97 49" 
第 4 趟 后 : [27 38 49 49' 91] 03 97 49" 


- “ 
hy i i De ed i es ah di 
>= = -="-—" "~" "="™"-™ 


第 5 趟 后 : [03 27 38 49 49 91] 97 49 


第 6 趟 后 [03 27 38 49 49 、91 97] 49" 


全 
~- 
T= ~ 


第 7 趟 后 ， [03 27 38 49 49 49 91 97] 


图 7.1 直接 插入 排序 示例 


将 无 序 区 第 一 个 记录 RD] (i=2, 3,…, n) 插入 到 有 序 区 RI] 一 人 [1 时 ， 可 以 先 在 有 序 
区 中 找到 插入 位 置 k (1 科 k 科 1)， 然 后 将 其 后 记录 R[kK]~~R[i~1] 均 后 移 一 位 ， 腾 出 位 置 k 
以 插入 R 上 ]。 但 是 ， 更 为 有 效 的 方法 是 将 寻找 插入 位 置 和 移动 记录 交 棕 进行， 即 从 有 序 区 
的 后 部 开始 ， 如 果 该 位 置 j (j=i-1, 二 2, …, 1) 的 记录 大 于 待 插 记录 ， 则 直接 后 移 一 位 ; 待 
插 记 录 则 插入 到 最 后 空 出 来 的 位 置 上 。 算 法 如 下 : 


Vold InsertSort (11st R,int n) { 


Lt 

for (i=2;i<=n;i++) { // 依 次 插入 R[2],R[3],*…,RI[n] 
if (R[i] .key>=R[i-1] .key) continue;//R[i] 大 于 有 序 区 最 后 一 个 记录 ， 不 需 插入 
R[0]=R[i]; //RL[0] 是 监视 哨 
]=1—1; 
do { // 查 找 R[i] 的 插入 位 置 

R[j+1]=R[j];j——; // 记 录 后 移 ， 继 续 向 前 搜索 

} while(R[0] .key<R[j] .key); // 省 略 了 条 件 ]j>=1 
R[j+1]=R[0]; // 插 入 RI[i] 

} 

} 


算法 中 引入 附加 记录 R[0] 有 两 个 作用 : 其 一 是 进入 得 找 循环 前 ， 保 存 RD] 的 副本 《〈 记 
录 后 移 时 会 冲 挥 RD]]); 其 二 是 在 while 循环 中 “监视 ”下 标 变量 j 是 合 越 界 ， 一 旦 越界 〈 即 
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j<1)，R[0] 自 动 控 制 while 循环 的 结束 〈 此 时 j=0， 循 环 条 件 R[0].key<RD].key 不 成 立 )， 从 
而 可 避免 在 while 循环 中 检查 j 是 否 越 界 〈( 即 省 略 了 循环 条 件 “j 三 1”)。 因 此 ， 我 们 把 R[0] 
称 为 “监视 哨 〈(Sentinel1)”。 这 种 技巧 ， 使 得 测试 循环 条 件 的 时 间 大 约 减 少 一 半 ， 如 果 记 录 
数 很 多 ， 节 约 的 时 间 可 能 是 相当 可 观 的 。 

直接 插入 排序 算法 简单 明了 , 它 由 两 重 循环 组 成 : 外 循环 表示 要 进行 n-1 趟 插入 排序 ， 
内 循环 表示 每 趟 排序 中 关键 字 的 比较 和 记录 的 后 移 。 知 初始 数据 表 为 升序 ( 正 序 )， 则 每 趟 
排序 中 仅 需 进行 一 次 关键 字 的 比较 ， 总 的 关键 字 比 较 次 数 为 最 小 值 Cuwn=n-1; 并 且 每 趟 排 
序 中 无 需 后 移 记 录 ， 总 的 记录 移动 次 数 最 小 值 为 Main=0。 

反之 ， 丰 初始 数据 表 为 降序 〈 反 序 )， 则 关键 字 的 比较 次 数 和 记录 移动 次 数 均 达到 最 
大 值 。 此 时 ， 对 for 循环 的 每 一 个 1 值 ， 因 当前 有 序 区 RI] 一 了 [二 ]] 的 关键 字 均 大 于 竺 插入 
记录 R[] 的 关键 字 ， 所 以 while 循环 中 要 进行 1 次 比较 才 终 止 〈 终 止 点 为 监视 哨 人 [0])， 同 
时 有 序 区 中 所 有 的 二 1 个 记录 均 后 移 了 一 个 位 置 ， 再 加 上 while 循环 前 后 R[0] 的 两 次 移动 ， 
则 移动 记录 的 次 数 为 二 1+2。 可 见 排序 过 程 中 总 的 关键 字 比 较 次 数 的 最 大 值 Cna 和 总 的 记 
录 移 动 次 数 的 最 大 值 Maax 分 别 为 : 


Mo =- 六 G-1+2) = 也 -OO) 


由 上 述 分 析 可 知 ， 数 据 表 的 初始 状态 不 同时 ， 直 接 插 入 排序 所 耗费 的 时 间 会 有 很 大 状 
异 。 节 好 情况 是 初 态 为 正 序 ， 此 时 算法 的 时 间 复 杂 度 为 O(n)， 最 坏 情 况 是 初 态 为 反 序 ， 相 
应 的 时 间 复 杂 度 为 O(n”)。 易 知 算法 的 平均 时 间 复 杂 度 也 是 O(n*)”。 当 初始 序列 基本 有 序 
或 n 较 小 时 ， 它 是 最 佳 的 排序 方法 ， 但 对 记录 数 n 较 大 的 数据 表 就 不 适合 了 。 

直接 插入 排序 所 需 的 辅助 空间 是 一 个 监视 哨 ， 故 空间 复杂 上 度 为 0(1)。 直 接 插 入 排序 中 
记录 的 移动 是 按 相 邻 位 置 顺序 进行 的 ， 故 是 稳定 的 。 

显然 ， 有 序 区 也 可 在 数据 表 的 尾部 生成 ， 分 析 方 法 和 结论 类 似 《〈 略 )。 

上 述 直 接 插 入 排序 算法 虽然 人 简单， 但 效率 不 高 。 一 般 可 作 如 下 改进 : 

(1) 二 分 / 折 半 插入 。 在 有 序 区 中 寻找 插入 位 置 时 ， 利 用 有 序 性 进行 二 分 查找 (每 次 将 
当前 等 插入 元 素 与 有 序 区 中 点 位 置 上 的 元 素 比 较 ， 见 下 一 章 )， 这 时 插入 第 i 个 元 素 时 最 多 
比较 [log,i| 次 丈 能 确定 插入 位 置 ， 总 比较 次 数 最 多 为 [log, i |~ log,(n —1)!=O(nlog,n)，; 


虽 不 及 下 接 插入 排序 的 最 好 情况 ， 但 比 其 平均 和 最 坏 情 况 好 得 多 ， 不 过 移动 次 数 不 变 。 
(2) 二 路 插入 。 在 数据 区 的 两 端 形成 局 低 两 个 有 序 区 ， 每 次 插入 到 其 中 一 个 ， 使 两 者 

长 度 始终 相当 。 这 样 平 均 插 入 长 度 就 只 有 一 个 有 序 区 时 的 一 半 ， 即 效率 可 提高 一 倍 左右 。 
但 这 些 改进 不 是 实质 性 的 , 效率 仍 为 O(n )。 下 述 希 尔 排序 能 使 效率 提高 到 O(n ) 以 下 。 


= O(n’) 


@ 每 次 对 有 序 区 R[1]~Ri-1] 查 找 时 ， 平均 比较 二 2 二 -二 次 ( 见 下 一 章 顺 序 查找 )， 故 总 的 平均 
比较 及 移动 次 数 为 7 = Om) 
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7.2.2 希 尔 排序 


希 尔 排 序 (Shell Sort) 又 称 " 缩 小 增 量 排序 ”Diminishing Increment Sort), 是 由 D.L.Shell 
在 1959 年 提出 来 的 。 它 的 基本 方法 是 : 将 数据 表 分 成 向 干 组 ， 所 有 相隔 为 茶 个 “ 增 量 ”的 
记录 为 一 组 ， 在 各 组 内 进行 直接 插入 排序 ;初始 时 增 量 d 较 大 ， 分 组 较 多 (每 组 的 记录 数 
少 ), 以 后 增 量 逐 渐 减 少 , 分 组 减少 (每 组 的 记录 数 增多 ), 直到 最 后 增 量 为 1(di>d>…>dF1)， 
所 有 记录 为 同一 组 ， 再 整体 进行 一 次 直接 插入 排序 。 

下 面 看 一 个 具体 例子 。 取 数据 表 同 图 7.1， 增 量 序列 取 为 : 5, 3, 1。 

第 一 趟 排序 时 ，d1=5， 整 个 数据 表 被 分 成 5 组 , (Ri, Re)、(Rs, R7)、(R3, Re)、(R4)、(R;)， 
其 中 (Ry)、(Rs) 目 成 一 组 。 分 别 对 各 组 进行 直接 插入 排序 ， 结 果 见 图 7.2 的 第 一 趟 结果 。 

第 二 趟 排序 时 ，d=3， 整 个 数据 表 分 成 三 组 : (Rj, Ry, R7)、(Rz, Rs, Re)、(R3, Re)， 分 别 
对 各 组 进行 直接 插入 排序 ， 得 到 第 二 趟 排序 结果 。 

最 后 一 趋 排序 时 ，ds=1， 即 对 整个 数据 表 做 直接 插入 排序 ， 其 结果 即 为 有 序 表 。 整 个 
排序 过 程 如 图 7.2 所 示 。 


初始 关键 字 49 38 49' 91 27 03 97 49" 


49 03 
d1=5 LL | 
38 97 
| | 
49' 49" 
LL | 
91 
| 
27 


03 91 97 
d=3 -一 一 一 
38 27 49" 
L | | 
49' 49 
| | 
第 二 趟 结果 03 a 49' 91 38 49 97 49" 
LL | | | | | | 
ds=1 


7.2 和 布尔 排序 示例 


显然 ， 夺 一 开始 就 取 增 量 为 1， 则 希 尔 排序 就 是 直接 插入 排序 。 
各 不 设置 监视 哨 ， 则 每 趟 希 尔 插入 排序 算法 如 下 : 
void ShellInsert (list R,int n,int h) {// 一 趟 插入 排序 ，h 为 本 趟 增 量 
下 而 和 了 
for(i=1s1<=hy1+4) //i 为 组 号 
for (j=i+h;j<=n;j+=h) { // 每 组 从 第 2 个 记录 开始 插入 
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if(RI] .key>=R[j-h] .key) continue;//R[j] 大 于 有 序 区 最 后 一 个 记录 ， 不 需 插 入 


R[0]=R[j]; / /RI[0] 保 存 待 插 记 录 ， 但 不 是 监视 哨 
k=]—h; // 待 插 记 录 的 前 一 个 记录 
do { // 但 找 正确 的 插入 位 置 
R[k+h]=R[K] ; k=k-—h; // 后 移 记 录 ， 继 续 疝 前 搜索 
} while(k>0 && R[0] .key<RI[k] .key); 
R[k+h]=R[0]; // 插 入 R[j] 
} 


} 

注意 ， 算 法 中 的 两 个 for 循环 可 以 合并 为 一 个 : forG=1+h; j<=n; j++)， 这 相当 于 对 每 组 
交 蔡 看 进行 直接 插入 排序 ， 这 时 循环 控制 的 开销 少 了 ， 实 际 执行 起 来 也 快 些 。 

如 果 采 用 监视 哨 技 术 ， 则 插入 排序 时 每 组 都 要 设 一 个 监视 哨 。 设 当前 增 量 为 h， 则 各 
组 监视 哨 的 位 置 分 别 为 1-h, 2-h,…, 0。 这 些 位 置 基本 上 都 在 数组 下 标 范 围 之 外 ， 为 了 避 
免 移 动 数 据 表 ， 可 在 数组 低 妆 预先 《〈 按 最 大 增 量 ) 空 出 右 二 位置。 另外， 为 了 避免 对 多 个 
监视 哨 的 赋值 和 每 趟 中 的 修改 , 可 将 所 有 监视 哨 都 设 为 -=ce《〈 实 取 小 于 所 有 键 值 的 数 即 可 )。 
显然 ， 如 果 采 用 尾部 生成 有 序 区 的 插入 排序 ， 则 不 必 改 变数 据 区 位 置 ， 在 数组 高 端 预 留 足 
够 位 置 即 可 ， 具 体 算法 略 ( 见 习题 7.12 )。 

硕 尔 排序 过 程 就 是 调用 知 干 直 斋 尔 插入 排序 ， 主 算法 如 下 : 

Vold Shel1lSort (11st R,int n)tft 

工科 Ti 

for (h= 第 一 个 增 量 ; ;h= 下 一 个 增 量 )  // 各 趟 插入 排序 
ShellInsert (R,n,h); 
1f (h==1) break; 

} 

其 中 第 一 个 增 量 和 下 一 个 增 量 的 求法 ， 取 决 于 具体 的 增 量 序列 和 算法 ， 如 第 一 个 增 量 
十 n/2|， 下 一 个 增 量 =max(h/2.2 1) 等 。 若 增 量 序列 的 形成 比较 繁琐 ,也 可 预先 求 出 后 保存 
到 菏 数 组 ， 则 “第 一 个 增 量 ” 就 是 在 该 数组 中 找 合 适 的 最 大 增 量 ,“ 下 一 个 增 量 ” 就 是 数组 
中 的 下 一 个 元 素 。 

布尔 排序 的 效率 与 增 量 序列 的 选取 有 关 ， 但 增 量 序列 如 何 选择 最 好 ， 目 前 尚 无 定论 。 
和 布尔 的 取 法 是 d=lLn/2|1，d=|d/2|，di=l1，t=llogn|” 。Knuth 建议 取 
di=|(di-D/3| ，d =1 ，t=llogin-1| ;Hbbard 取 d,=|(d-D/2| ，di=1， 
t=|logsn 一 1 || 等。 显然 ， 增 量 友 列 的 最 后 一 个 值 应 为 1， 其 他 几 个 值 之 间 应 该 没有 公 因 子 
(1 除外 )， 如 5, 3, 1。 

假设 增 量 每 次 除 以 2, 则 希 尔 排序 执行 的 趟 数 为 O(log,n) 。 每 趟 排序 时 , 数据 分 为 q, 组， 
每 组 内 数据 的 个 数 约 为 n/d 个 ， 所 以 每 趟 排序 的 效率 最 好 为 d x O(n/d,)=O(n)， 最 坏 为 
d; xO((n/d;》)=O(n? /qd,)， 各 赵 最 坏 的 平均 则 为 O(n? /log,n)”。 但 实际 上 各 趟 分 组 排序 


@Q) 这 时 如 果 增 量 恰好 为 2 的 方 次 ， 如 16, 8, 4, 2, 1， 则 效果 很 差 ， 因 为 前 一 趟 比较 过 的 数据 在 下 一 趟 


叉 位 于 同一 组 而 再 次 比较 ; 而 后 期 增 量 为 2 时 对 应 的 2 组 数据 ， 相 互 间 在 之 前 又 从 没有 比较 过 。 
专 王 cn 221-— 2 1 
@ 不 妨 设 d=25, 2 …, 1，k =logzn ， 则 各 趟 最 坏 的 平均 为 忆 忆 =- 台 志 -一 1L-12 -mL2- 
k+l k+l k+l] kKk+] 


OA = O(n /logyn) 。 
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时 ， 数 据 和 逐渐 接近 有 序 ， 每 趟 的 最 坏 情 况 随 痢 趟 数 的 增加 基本 上 不 会 出 现 ， 所 以 希 尔 排 序 
的 整体 效率 在 O(log,n)xO(n)=O(nlogyn) 和 OoOdog,n)xoam2yVlogn)=O2) 之 间 。 但 复杂 
性 的 具体 表达 式 , 除了 少数 特殊 的 增 量 序列 外 , 目前 还 没有 理论 结果 (但 肯定 与 增 量 有 关 )。 
数值 试验 表明 , 希 尔 排序 的 平均 比较 次 数 和 平均 移动 次 数 一 般 可 达 O(n ”), 如 Oa 一) 以 下 ， 
优 于 直接 插入 排序 。 究 其 原因 一 般 有 如 下 两 种 解释 : 

其 一 ， 加 速 原理 。 希 尔 排 序 将 相隔 为 某 个 增 量 的 记录 组 成 子 序 列 ， 排 序 时 子 序列 中 茶 
个 记录 问 前 或 回 后 移动 一 位 ， 相 对 于 原 序列 而 言 ， 则 移动 了 辱 干 位 ， 这 有 使 记录 加 速 癌 日 
标 位 置 移动 的 趋势 。 一 般 地 ， 序 列 的 无 序 程度 越 大 ， 记 录 离 它 的 最 终 位 置 就 越 远 ， 这 种 加 
速 的 效果 就 越 明 显 。 排 序 开始 时 序列 的 无 序 程度 最 大 ， 而 这 时 的 增 量 也 最 大 ， 正 好 适应 了 
快速 移动 的 要 求 ;， 以 后 每 完成 某 个 增 量 下 的 排序 后 ， 序 列 的 有 序 程度 就 提高 了 一 些 ， 相 应 
地 加 速 步伐 就 应 小 一 些 ， 而 这 时 新 的 增 量 也 缩小 了 ， 正 好 义 适 应 了 这 种 要 求 。 

其 二 ， 有 友和 小 规模 原理 。 和 直接 插入 排序 在 数据 表 初 态 基 本 有 序 时 时 间 性 能 较 好 ( 初 
态 为 正 序 时 所 需 时 间 最 少 ); 另 一 方面 , 当 nm 较 小 时 , 直接 插入 排序 的 最 好 时 间 复 杂 度 O(n) 
和 最 坏 时 间 复 杂 度 O(n ) 差 别 不 大 。 希 尔 排 序 开始 时 增 量 较 大 , 分 组 较 多 , 每 组 的 记录 数 较 
少 ， 故 各 组 内 直接 插入 较 快 ， 后 来 增 量 di 逐渐 缩小 ， 分 组 减少 ， 每 组 的 记录 数 增 多 ， 但 由 
于 已 按 增 量 d-i 排 过 序 ， 数 据 表 较 接 近 于 有 序 状 态 ， 所 以 新 的 一 趟 排序 也 较 快 。 

但 这 种 分 析 不 能 解释 为 什么 布尔 排序 的 子 序列 不 是 简单 地 “ 逐 段 分 割 ”， 而 是 将 相隔 
为 某 个 增 量 的 记录 组 成 一 个 子 序列 这 个 问题 。 

布尔 排序 中 记录 在 一 定 的 间 隐 下 监 越 移 动 ， 可 能 跨 过 相同 的 关键 学 ， 从 而 改变 它们 的 
相对 次 序 ， 故 是 不 稳定 的 。 

布尔 排序 的 改进 主要 在 增 量 序列 的 选取 上 ， 显 然 效 果 最 好 也 只 能 是 接近 O(nlogn) 。 
几 个 效果 较 好 的 增 量 序列 如 

Gonnet:h, =|Ln/2j，h,， -| 2 h, =1。 

Sedgewick: …, 209, 109, 41, 19, 5, 1 , 增 量 为 9.4-9.2+1 6 三 0) 和 4-3.2i+1 0 三 2) 的 合并 。 

以 上 介绍 的 增 量 序列 基本 上 都 是 几何 级 数 类 型 的 ， 实 验 表 明 ， 其 中 的 较 好 者 相对 于 较 
差 者 改进 显 铸 ,但 较 好 者 之 同性 能 比较 接近 ， 即 这 类 序列 的 改进 已 经 越 来 越 困 难 了 。 男 外 
还 有 一 类 超 短 序列 , 如 仅 2、3 个 增 量 的 h,1、h, kk, 1 等 , 适当 选取 h、k, 效果 也 可 达 Oil59， 
如 Om”™)， 但 比 几何 级 数 类 中 的 较 好 者 差 。 具 体 就 不 细 述 了 。 


.3、 交 换 排序 


交换 排序 的 基本 思想 是 : 每 次 比较 两 个 每 排序 的 记录 ， 如 果 发 现 它们 的 大 小 次 序 与 排 
序 要 求 相 反 时 就 交换 两 者 的 位 置 ， 直 到 没有 反 序 的 记录 为 止 。 交 换 排 序 的 特点 是 : 较 大 的 
记录 癌 数 据 和 表 的 一 痛 移 动 ， 较 小 的 记录 加 数据 表 的 另 一 端 移 动 。 本 节 介 绍 两 种 交换 排序 : 
冒 泡 排 序 和 快速 排序 。 
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7.3.1 冒 泡 排序 


冒 泡 排 序 (Bubble Sort) 的 基本 思想 是 ， 设 想 数 据 表 R[1] 一 人 [mn] 垂 直 放 置 ， 将 每 个 记 
录 R[i] 看 做 是 重量 为 RI].key 的 气泡 ; 根据 轻 气 泡 不 能 在 重 气 泡 之 下 的 原则 ， 从 下 往 上 扫 
描 数 组 R， 凡 违反 本 原则 的 轻 气 泡 ， 就 使 其 同上 “ 球 浮 ?， 如 此 反复 进行 ,直到 最 后 任何 两 
个 气泡 都 是 轻 者 在 上 ， 重 者 在 下 为 止 。 这 个 过 程 类 似 和 气泡 从 水 中 往 上 冒 的 情形 ， 故 得 名 。 

初始 时 ，R[II] 一 RD] 为 无 序 区 。 第 一 趟 扫 摘 从 该 区 底部 RDm 问 上 依次 比较 相 邻 两 个 气 
泡 的 重量 ， 大 发 现 轻 者 在 下 ， 重 者 在 上 ， 则 交换 两 者 的 位 置 。 本 趟 扫描 完毕 时 ,“ 节 轻 ” 的 
气泡 就 丈 浮 到 最 上 和 面 ， 即 关键 字 最 小 的 记录 被 放 在 了 最 高 位 置 R[1]| 上 。 第 二 赵 扫 描 时 ， 只 
需 扫 描 Rm] 一 R[2]， 扫 摘 完 毕 时 ,“ 次 轻 ” 的 气泡 球 浮 到 及 [2] 的 位 置 上 。 其 余 依 此 类 推 。 

图 7.3 是 冒 泡 排 序 过 程 的 示例 ， 第 1 列 〈 第 0 趟 ) 为 初始 关键 字 ， 其 他 各 列 依次 为 各 
趟 排序 〈 即 各 趟 扫描 ) 结果 ， 图 中 用 方 括号 表示 竺 排序 的 无 序 区 。 


趟 次 ”0( 初始 ) 1 2 本 4 5 6 7 
四 
49 03 03 03 03 03 03 03 


三] 
38 49 27 27 27 27 27 27 
四 
49' 38 49 38 38 38 38 38 
三] 
91 49' 38 49 49 49 49 49 
站 1 
al 91 49' 49' 49' 49' 49' 49' 
本 
03 Zi 91 49 49" 49" 49" 49 
站 中 

97 49 49 91 91 91 91 91 

四 
49 97 97 97 97 97 97 97 
LJ Lj LJ LJ [| [| [| LL 


图 7.3 ”上升 法 冒 泡 排序 


冒 泡 排 序 也 可 从 无 序 区 项 部 RU] 开始 同 下 扫描 ， 这 时 每 一 趟 是 一 个 “最 重 ” 的 气泡 沉 
到 的 部 。 为 了 区 分 ， 前 面 的 方法 称 为 上 升 法 ， 后 面 的 方法 称 为 下 沉 法 。 以 下 我 们 只 考虑 上 
升 法 。 显 然 ， 对 上 升 法 ， 每 次 相 邻 比较 后 的 交换 中 ， 较 小 者 总 是 沿 看 最 终 位 置 方 巾 进 行 ， 
但 男 一 个 则 可 能 暂时 移 癌 相反 方 问 。 

因为 每 一 趟 排序 都 使 有 序 区 增加 一 个 气泡 , 在 经 过 n-1 趟 排序 之 后 , 有 序 区 中 就 有 mr-1 
个 气泡 ， 而 无 序 区 中 气泡 的 重量 总 是 大 于 等 于 有 序 区 中 气泡 的 重量 ， 所 以 ， 整 个 骨 泡 排序 
过 程 全 多 需要 进行 n-1 超 排序。 但是， 大 在 茶 一 趟 排序 中 未 发 现 气泡 位 置 的 交换 ， 则 说 明 
竺 排序 的 无 序 区 中 所 有 气泡 均 满足 “ 轻 者 在 上 ， 重 者 在 下 ”的 原则 。 因 此 ， 冒 泡 排 序 过 程 
可 在 此 趟 排序 后 终止 。 例 如 ， 在 图 7.3 的 示例 中 ， 在 第 四 趟 排序 过 程 中 就 没有 气泡 交换 位 
置 ， 此 时 整个 数据 表 就 已 达到 有 序 状 态 了 。 为 此 ， 引 入 一 个 标志 fag， 用 以 表示 记录 是 个 
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发 生 过 交换 。 在 每 趟 排序 之 前 ， 先 将 它 置 为 0， 如 果 排 序 中 有 记录 交换 ， 则 将 它 置 为 1。 这 
样 一 趟 排序 结束 后 ， 检 查 fag， 如 果 不 为 1 则 未 曾 有 记录 交换 ， 排 序 结束 。 整 个 算法 如 下 


void BubbleSort (list R,int n) { // 上 升 法 冒 泡 排序 
也 世 证 1 本 7 


for (i=1;i<=n—1;i++) { // 做 n-1 趟 扫 摘 
Flads(0s // 置 未 交换 标志 
for (j=n; j>=i+1;]j——) // 从 下 加 上 扫 摘 

if (R[j] .key<R[j-1] .key) { // 交 换 记 录 
flag=1; 


RI[0]=R[j];R[j]=R[j-1];R[j-1]=R[0]; // 交 换 ，R[0] 作 辅助 量 
} 
if(!flag) break; // 本 趟 未 交换 过 记录 ， 排 序 结束 
} 
} 


容易 看 出 ， 知 数据 表 的 初 态 是 正 序 的 ， 则 一 直 扫 拉 残 可 完成 排序 ， 关 键 字 的 比较 次 数 
为 n-1， 且 没有 记录 移动 。 也 就 是 说 ， 时 泡 排 序 在 最 好 情况 下 ， 时 间 复 杂 上 度 是 O(n)。 

右 初 始 数据 表 是 反 序 的 ， 则 需要 进行 n-1 趟 排序 ， 每 趟 排序 要 进行 n-i 次 关键 字 的 比 
较 〈1 科 ji 入 n-1)， 且 每 次 比较 都 必须 3 次 移动 记录 来 交换 位 置 。 这 时 ， 比 较 次 数 Caax 和 移 
动 次 数 Momax 均 达 到 最 大 值 : 


Ce = Tn) = = On’) 
M -号 3 下- = On’) 


因此 ， 冒 泡 排 序 的 最 坏 时 间 复 杂 度 为 O(n )。 

虽然 冒 泡 排序 可 能 在 中 间 某 趟 后 结束 ， 但 易 知 其 平均 排序 趟 数 仍 为 O(n)， 由 此 可 得 平 
均 比 较 次 数 仍 是 O(n”)， 即 算法 的 平均 时 间 复 杂 度 也 为 O(n”)。 

冒 泡 排序 需要 的 辅助 空间 为 1， 用 于 交换 记录 ， 在 上 述 算法 中 用 R[0] 代 替 。 

由 于 只 对 相 邻 记录 进行 顺序 比较 和 交换 ， 冒 泡 排序 是 稳定 的 。 

上 述 冒 泡 排序 算法 还 可 作 如 下 改进 : 

(1) 对 每 趟 扫描 ， 记 住 最 后 一 次 发 生 交 换 的 位 置 last， 在 该 位 置 之 前 的 记录 了 [一 
R[last-]] 没 有 发 生 交 换 ， 即 已 经 有 序 ， 所 以 下 一 趟 扫 摘 只 需 对 R[lastl 一 人 R[m] 进 行 。 

(2) 假设 最 重 的 气泡 在 顶部 ， 其 余 气 泡 已 有 序 ， 则 对 上 升 法 需要 n-1 趟 扫描 (才能 六 
该 气泡 沉 到 底部 ); 但 对 下 沉 法 只 需 一 趟 扫描 即 可 。 反 之 ， 如 果 最 轻 的 气泡 在 底部 ， 其 余 气 
泡 已 有 序 ， 则 对 下 沉 法 需要 n-1 趟 扫描 ， 对 上 升 法 只 需 一 趟 。 为 了 改善 类 似 情 况 下 的 效率 ， 
可 以 在 排序 过 程 中 交替 改变 扫描 方向 ， 即 交替 使 用 上 升 法 和 下 沉 法 。 

这 些 改进 也 不 是 实质 性 的 ， 效 率 仍 为 OO)。 借 助 希 尔 排 序 的 思想 进行 分 组 冒 泡 排序 ， 
也 能 使 效率 提高 到 O(n) 以 下 ， 但 因 算 法 是 交换 型 的 ， 移 动 次 数 比 希 尔 排 序 多 ， 具 体 略 。 
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7.3.2 ”快速 排序 


快速 排序 (Quick Sort) 又 称 划分 交换 排序 ， 是 起 尔 〈C.A.R.Hoare) 1960 年 发 明 、1962 
年 正式 提出 的 。 其 基本 思想 是 ， 在 数据 表 中 任 取 一 个 作为 “基准 〈pivot)”， 将 其 余 记录 分 
为 两 组 ， 第 一 组 中 各 记录 均 小 于 或 等 于 基准 ， 第 二 组 中 各 记录 均 大 于 或 等 于 基准 ， 而 基准 
就 排 在 这 两 组 中 间 (这 也 是 该 记录 的 最 终 位 置 )， 这 称 为 一 趟 快速 排序 (或 一 次 划分 )。 对 
所 分 成 的 两 组 记录 分 别 重复 上 述 方法 ， 直 到 每 组 只 有 1 个 记录 为 止 。 

快速 排序 的 基本 步 又 是 划分 。 设 生 划 分 区 间 为 RIp] 一 人 R[q]， 不 妨 取 无 序 区 第 1 个 记录 
为 基准 。 第 见 的 划分 算法 有 如 下 三 种 。 

划分 算法 1: 交 丛 扫描 《参见 例 2.1)， 从 后 加 前 找 比 基准 小 的 记录 ， 上 再 从 前 问 后 找 比 
基准 大 的 记录 ， 两 者 交换 。 于 是 将 基准 右边 的 区 间 RIp+1] 一 R[q] 分 成 两 部 分 ， 左 部 分 三 基 
准 ， 右 部 分 过 基准 ;然后 将 基准 和 左 部 分 的 最 后 一 个 交换 便 得 到 划分 结 打 。 这 个 算法 进行 
en 每 次 交换 由 3 次 移动 实现 。 

划分 复 法 2: 交 殖 扫 拉 ， 从 后 问 前 找 比 基准 小 的 记录 与 基准 交换 ， 册 从 前 问 后 找 比 基 
ER 交换 

这 相当 于 把 算法 1 中 后 面 小 记录 与 前 面 大 记录 的 交换 改 成 了 等 效 的 2 次 交换 : 后 面 小 
记录 先 与 基准 交换 、 基 准 册 与 前 面 大 记录 交换 。 表 面 上 看 记录 的 移动 次 数 更 多 了 〈2x3=6 
次 ), 但 实际 上 , 基准 在 中 途 的 各 次 交换 都 是 临时 的 , 仅 最 后 一 次 交换 后 才 是 它 最 终 的 位 置 。 
于 是 划分 中 途 基 准 的 交换 并 不 需 真正 进行 ， 仅 在 划分 完成 得 到 最 终 位 置 后 才 放 入 该 处 。 这 
样 中 途 的 等 效 交 换 中 只 需 2 次 移动 : 后 面 小 记录 移 到 基准 处 、 前 面 大 记 移 到 基准 处 〈 详 见 
下 文 及 图 7.4 〈a))， 从 而 减少 了 移动 次 数 。 

划分 算法 3: 单 癌 扫描 ， 使 扫描 过 的 数据 分 成 小 值 区 和 大 等 值 区 。 对 当前 扫 朱 记录， 
在 小 于 基准 ， 则 把 它 与 大 等 值 区 的 首 元 素 交 换 ， 即 小 值 区 扩大 一 位 ; 人 否则 大 等 值 区 目 动 扩 
大 一 位 。 

这 个 算法 在 进行 中 已 形 成 的 大 值 等 区 不 是 其 最 终 位 置 ， 有 一 种 整体 上 随 看 小 值 区 的 增 
长 而 问 后 移动 的 趋势 ， 所 以 总 的 移动 量 比 前 面 的 两 个 算法 都 多 。 

以 前 述 划 分 算法 2 为 例 ， 图 7.4 (a) 展示 了 一 次 划分 过 程 ， 其 中 阴影 框 表示 基准 。 具 
体 过 程 为 ， 设 置 两 个 指针 1 和 j， 其 初 人 分 别 为 p 和 q; 将 基准 RD] 保存 到 辅助 变量 x 中 。 
首先 ， 令 ] 从 右 癌 左 扫描 ， 直 到 找到 1 个 小 于 基准 x 的 记录 RD]， 将 它 移 到 位 置 1 处 《相当 
于 交换 RD] 和 基准 RIil]， 即 x， 使 小 于 基准 的 记录 移 到 基准 的 左边 ); 然后 ， 令 i 从 i+l 起 
从 左 癌 右 扫描 ， 直 至 找到 1 个 大 于 基准 的 记录 R[il， 将 它 移 到 位 置 ] 处 (相当 于 交换 R[j] 
和 基准 RD], 即 x, 使 小 于 基准 的 记录 移 到 基准 的 左边 ); 接 看 ,再 令 j 目 ji1 起 问 左 扫描 ，……， 
如 此 交替 改变 扫描 方 问 ， 从 两 疹 各 目 往 中 间 菲 拢 ， 直 全 十 时 ，1 便 是 基准 X 的 最 终 位 置 ， 
将 它 放 在 此 处 就 完成 了 一 次 划分 。 

int Partition(list R,int p,int 9q) 

// 对 无 序 区 R[p]~R[q] 划 分 ， 返回 划分 后 基准 的 位 置 双 问 扫描 

i 
ee //RL0] 作 辅助 量 x ， 存 放 基 准 ， 基 准 取 为 无 序 区 第 一 个 记录 
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while(1<]) { 
while (i<j] && R[j].key>=R[0] .key) j--; // 从 右 问 左 扫描 


if (i<j) {R[i]=R[j];i++;} // 交 换 R[i] 和 RI[j] 
while(i<] && RI[i] .key<=R[0] .key) i++; // 从 左 问 右 扫 描 
if (i<j) {R[j]=R[i];j-—;} // 交 换 R[i] 和 RI[j] 
} 
R[i]=R[0]; // 将 基准 移 到 最 后 的 正确 位 置 


return 1; 
} 
快速 排序 过 程 是 一 种 “分 治 法 ” 通过 划分 得 到 两 个 子 区 间 ， 对 每 个 子 区 间 进 行 同样 
处 理 后 ， 将 结果 组 合 起 来 就 是 问题 的 解 。 这 个 过 程 是 递归 的 ， 很 容易 用 递归 算法 实现 。 设 
竺 排序 区 间 为 R[s] 一 R[t， 完 成 一 趋 划分 后 得 到 基准 位 置 1， 接 看 就 对 区 间 R[s]~~R[i~1]、 
R[i+1l] 一 人 R 虽 进行 递归 处 理 。 主 算法 如 下 : 
void QuickSort (list R,int s,int t) {// 对 R[s]~RI[t] 快 速 排 序 
了 二 二 > 
于 二 (ae Toburis // 只 有 一 个 记录 或 无 记录 时 无 需 排 序 
i=Partition(R,s,t);  // 对 R[s]~R[t] 做 划分 
QuickSort (R,s,i-1);  // 递 归 处 理 左 区 间 
QuickSort (R, i+l,t);  // 递 归 处 理 在 区 间 
} 


对 整个 数据 表 及 进行 快速 排序 ， 只 需 调 用 QuickSort(R, 1, nm) 即 可 。 
图 7.4 (b) 展示 了 整个 快速 排序 过 程 ， 其 中 方 括号 表示 无 序 区 。 


初始 关键 字 : [ 罗 38 4 91 27 03 97 49"] 
人 t 
j 向 左 扫描 i = 
第 一 次 交换 后 [03 38 49 91 27 国 97 49"] 
疝 右 扫 撞 LO 
第 二 次 交换 后 [0 38 49 国 27 91 97 49"] 
t 人 
/加 左 扫描 ， 位 置 不 变 | i 
第 三 次 交换 后 [03 38 49 27 国 91 97 49"] 
t + 
i 问 右 扫描 ji-=j 
基准 最 后 位 置 [03 38 49% 27 91 97 49"] 
tt 
1] 
(a) 一 次 划分 过 程 
初始 关键 字 : [49 38 49 91 27 03 97 49"] 
一 趟 排序 后 : [03 38 49 27] 49 [91 97 49"] 
二 趟 排序 后 : 03 [38 49% 27] 49 [49"] 91 [97] 
三 趟 排序 后 : 03 27 [38] 49 49 49” 91 97 
最 后 的 排序 结果 : 03 27 38 49 49 49” 91 97 


(b) 各 趟 排序 之 后 的 状态 


图 7.4 快速 排序 示例 
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快速 排序 可 看 成 骨 泡 排序 的 一 种 改进 ， 比 较 和 交换 的 记录 前 后 相距 较 远 ， 较 大 的 记录 
一 次 就 能 交换 到 较 后 位 置 ， 较 小 的 记录 一 次 驶 能 交换 到 较 前 位 置 。 由 于 每 次 移动 的 距离 较 
远 ， 因 而 总 的 比较 和 移动 次 数 较 少 。 

快速 排序 过 程 可 用 一 条 二 又 树 来 描述 : 树 根 表示 基准 , 左右 子 树 表示 划分 的 两 个 区 间 ， 
每 个 子 区 间 继 续 用 子 二 又 树 表示 ， 这 种 二 又 树 称 为 快速 排序 的 判定 树 。 如 图 7.4 的 快速 排 
序 过 程 可 用 图 7.5 的 二 又 树 表 示 。 显 然 ， 树 的 深度 就 是 快速 排序 的 递归 深度 ， 由 此 可 知 递 
归 上 所 需 栈 空间 的 大 小 。 最 好 情况 下 ， 每 次 划分 都 得 到 两 个 均匀 的 子 序 列 ， 栈 的 最 大 深度 为 
| logjn |+1， 上 所 需 栈 为 Odog,n) 。 节 坏 情 况 下 ， 二 广 树 是 一 箱 单 术 树 ， 递 归 深度 为 an， 所 需 
空间 为 O(n)。 


图 7.5 快速 排序 过 程 的 判定 树 


按 上 述 划分 算法 ， 每 次 都 取 当 前 无 序 区 的 第 1 个 记录 为 基准 ， 则 快速 排序 的 最 坏 情况 
是 初始 记录 已 经 有 序 ， 这 时 快速 排序 暗 化 为 冒 泡 排 序 。 每 次 划分 选取 的 基准 部 是 当前 无 序 
区 中 最 小 (或 最 大 〉 的 记录 ， 划 分 的 结果 是 基准 东 一 侧 左边 或 右边 ) 的 子 区 间 为 宇 ， 为 
一 侧 子 区 间 中 的 记录 数 仅 比划 分 前 区 间 的 记录 数 少 1。 因 此 ， 快 速 排序 要 做 n-1 趟 ， 每 一 
趟 要 进行 ni 次 比较 ， 总 的 比较 次 数 达 到 最 大 值 : 


Ci = Hi)= = O(n’) 


类 似 ， 如 果 初 始 记录 已 基本 有 序 时 ， 效 率 也 很 低 。 

在 最 好 情况 下 ， 每 次 划分 所 取 的 基准 都 是 当前 无 序 区 的 “中 值 ” 记 录 ， 划 分 的 结果 是 
基准 的 左 、 右 两 个 子 区 间 的 长 度 大 致 相等 。 设 C(n) 表 示 对 长 度 为 n 的 数据 表 进 行 快速 排序 
所 需 的 比较 次 数 ， 显 然 ， 它 应 该 等 于 对 长 度 为 n 的 无 序 区 进行 划分 所 需 的 比较 次 数 nr-1 加 
上 递归 地 对 划分 所 得 的 左 、 右 两 个 子 区 间 ( 长 度 万 /2) 进行 快速 排序 所 需 的 比较 次 数 。 假 
设 数 据 表 长 度 n=2*， 则 总 的 比较 次 数 为 : 

C(n) < n+2C(n/2) 
<n+2[n/2+2C(m/2°)|=2n+4C(/2°) 
< 2n+4n/4+2C(9/2°)|=3n+8C(/2) 


< kn+2°C(n2")=nlog,n+nC(]) 

= O(nlog,n) 
其 中 k=logn ，C() 表 示 对 长 度 为 1 的 区 间 进 行 快速 排序 的 比较 次 数 ， 为 一 常数 。 
因为 快速 排序 的 记录 移动 次 数 不 大 于 比较 的 次 数 ， 所 以 ， 快 速 排 序 的 最 坏 时 间 复 杂 虑 
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为 Oo)， 最 好 时 间 复 杂 度 为 Onlog,n) 。 

可 以 证 明 ， 快 速 排序 的 平均 时 间 复 杂 度 约 为 1.39nlogyn 〈 见 习题 7.10) ， 即 仍 为 
O(nlog,n)， 它 是 目前 基于 比较 的 内 部 排序 方法 中 速度 最 快 的 ~"， 故 得 名 (与 其 名 字 相 称 )。 

快速 排序 中 ， 记 录 在 前 后 两 侧 跨 越 移动 (或 交换 )， 可 能 跨 过 相同 的 关键 字 ， 从 而 改 
变 它们 的 相对 位 置 ， 故 是 不 稳定 的 。 

对 上 述 快速 排序 算法 还 可 做 很 多 改进 ， 比 如 : 

(1) 为 了 改善 最 坏 情况 下 的 时 间 性 能 ， 可 采用 “三 者 取 中 ”的 规则 ， 即 在 每 一 趟 划分 
开始 前 ， 首 先 比 较 RIp].key、R[q].key 和 R[L(p+q)/2j].key， 令 三 者 中 取 中 值 的 记录 作为 基 
准 《〈 与 第 一 个 交换 后 即 可 采用 上 述 方法 ) 。 另 一 种 常用 方法 是 在 区 间 中 随机 地 选择 一 个 作 
基准 ， 一 般 不 会 出 现 最 坏 情 况 。 

(2) 为 了 改善 递归 算法 的 时 空 性 能 ， 可 将 上 述 快速 排序 算法 改 成 非 递归 的 ， 这 需要 引 
进 一 个 栈 〈 或 队列 )， 最 多 不 超过 mn， 具体 算法 略 〈 见 习题 7.17)。 

(3) 因为 快速 排序 适合 n 较 大 的 情形 ， 故 对 长 度 较 小 的 子 序列 不 必用 快速 排序 ， 而 用 
插入 排序 。 也 可 对 长 度 小 的 子 序列 什么 也 不 做 , 最 后 得 到 一 个 没有 完全 排序 但 已 有 较 大 (分 
块 ) 有 序 程度 的 序列 ， 再 对 其 一 次 性 地 使 用 插入 排序 。 

(4) 当 数 据 表 中 有 大 量 重 复 〈 等 值 ) 数据 时 ， 快 速 排序 效率 很 低 。 这 时 可 在 每 次 划分 
完成 后 检查 基准 的 前 后 两 侧 ， 排 除 等 值 区 后 再 递归 处 理 前 后 两 部 分 。 


C4 选择 排序 


选择 排序 〈Selection Sort) 的 基本 思想 是 : 每 一 直 从 待 排序 的 记录 中 选 出 最 小 《或 最 
大 ) 的 记录 ,顺序 放 在 已 排 好 序 的 子 序列 的 最 后 (或 最 前 )， 和 直到 全 部 记录 排序 完毕 。 本 市 
介绍 两 种 选择 排序 方法 : 直接 选择 排序 和 堆 排 序 。 


7.4.1 直接 选择 排序 


直接 选择 排序 (Straight Selection Sort) 是 一 种 比较 简单 的 排序 方法 ， 它 的 做 法 是 : 首 
先 , 所 有 记录 组 成 初始 无 序 区 R[I1] 一 人 RIm], 从 中 选 出 最 小 的 记录 , 与 无 序 区 第 一 个 记录 R[1] 
交换 ; 新 的 无 序 区 为 R[2] 一 人 Im]， 从 中 再 选 出 最 小 的 记录 ， 与 无 序 区 第 一 个 记录 R[2] 交 换 ; 
类 似 ， 第 1 趟 排序 时 了 [1] 一 了 [1 是 有 序 区 ， 无 序 区 为 RD 一 Rn]， 从 中 选 出 最 小 的 记录 ， 
将 它 与 无 序 区 第 一 个 记录 及 [交换 ，R[I] 一 人 加 变 为 新 的 有 序 区 。 因 为 每 趟 排序 都 使 有 序 区 
中 增加 一 个 记录 ， 所 以 ， 进 行 na--]1 趟 排序 后 ， 整 个 数据 表 就 全 部 有 序 了 。 

直接 选择 排序 的 过 程 如 图 7.6 所 示 ， 图 中 方 括号 表示 当前 无 序 区 ， 虚 线 表 示 下 一 趟 要 

上 述 过 程 也 可 看 成 一 种 冒 泡 排 序 ， 每 次 比较 和 交换 的 是 无 序 区 的 最 小 记录 和 无 序 区 的 
第 一 个 记录 ， 而 不 总 是 相 邻 的 两 个 记录 。 这 样 总 的 比较 次 数 相同 ， 但 移动 次 数 则 大 大 减少 。 


@ 关键 字 比 较 次 数 并 非 最 少 ， 但 综合 关键 字 移动 次 数 和 程序 的 其 他 开销 ， 实 际 运行 时 间 通常 最 少 。 
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直接 选择 排序 算法 如 下 : 


Vold SelectSort (11st R,Int n) 1{ 
TREE 工 Jes 


for (1=171<=n-171++) { //n-1l 趟 排序 
k=1; 
for (J=i+1;]<=n;]J++) // 在 当前 无 序 区 中 找 最 小 的 记录 RI[Kk] 


if (R[jJ] .key<R[IK] .key) k=j; 
if (k!=i) {R[0]=R[i];R[i]=R[kK];R[K]=R[0];}// 交 换 R[i] 和 RI[k]，R[0] 作 辅助 
} 
} 


oa" 
py ay 


初始 关键 字 : [49 38 49 91 27 03 97 49"] 


oP ses 


第 一 趟 排序 后 : 03 [38 49' 391 广 49 97 49"] 


a" 


¥ 3 
第 二 越 排序 后 03 27 [49 91 38 49 97 49"] 


een, 


第 三 趟 排序 后 : 03 27 38 [91 49% 49 97 49"] 


4 
第 四 趟 排序 后 : 03 27 38 49' [91 49 97 49"] 


"~ 


第 五 趋 排 序 后 : 03 27 38 49 49 [91 97 49"] 


CE 


六 可 
第 六 趟 排序 后 ; 03 27 38 49' 49 49" [97 91] 
第 七 趟 排序 后 ; 03 27 38 49' 49 49" 91 [97] 
最 后 排序 结果 : 03 27 38 49' 49 49"” 91 97 


图 7.6 直接 选择 排序 示例 


显然 ， 无 论 数据 表 初 始 状 态 如 何 ， 在 第 1 趋 排序 中 选 出 最 小 关键 字 的 记录 ， 都 需 做 n-i 
次 比较 ， 因 此 ， 总 的 比较 次 数 为 : 


Co = Fi)= = O(n’) 


1 二 


全 于 记录 移动 次 数 ， 当 初始 数据 表 为 正 序 时 ， 移 动 次 数 为 0， 当 数据 表 初 态 为 反 序 时 ， 
每 趟 排序 均 要 执行 交换 操作 ， 所 以 ， 总 的 移动 次 数 取 最 大 值 3a-1)。 直 接 选 择 排 序 的 平均 
时 间 复 杂 度 为 OO-)。 由 于 记录 的 移动 次 数 较 少 , 所 以 当 记 录 本 身 的 数据 量 较 大 时 ,直接 选 
择 排序 比较 有 利 。 

直接 选择 排序 的 辅助 空间 为 1， 用 于 交换 记录 ， 上 面 算法 中 用 人 [0] 代 符 。 

直接 选择 排序 中 有 记录 的 跨越 交换 (将 无 订 区 最 小 或 最 大 记录 与 无 序 区 第 一 个 记录 的 
交换 )， 可 能 使 键 值 相 同 记录 的 相对 位 置 发 生 交 错 ， 故 是 不 稳定 的 。 

显然 ， 有 序 区 也 可 在 数据 表 的 尾部 生成 ， 分 析 方 法 和 结论 类 似 〈 略 )。 

直接 选择 排序 的 一 个 简单 改进 是 二 路 选择 : 每 次 扫描 选 出 最 小 、 最 大 两 个 记录 ， 分 别 
与 无 序 区 前、 尾 记 录 交 换 ， 即 在 数据 区 的 前 后 两 端 形成 两 个 有 序 区 。 其 中 选择 算法 可 参见 
习题 1.9 的 代码 调整 ， 可 一 定 程度 减 小 比较 次 数 ， 但 复杂 性 仍 是 O(n)。 
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7.4.2 ” 堆 排 序 


堆 排 序 是 对 直接 选择 排序 的 一 种 改进 。 在 讨论 堆 排 序 之 前 先 介 绍 一 下 树 形 选 择 排序 
(Tree Selection Sort ) 。 

在 直接 选择 排序 中 ， 为 了 从 na 个 记录 中 找 出 最 小 的 ， 震 要 进行 n-1 次 比较 ; 然后 在 剩 
下 的 nm-1 个 记录 中 找 次 小 的 ， 又 需 进 行 n-2 次 比较 ， 依 此 类 推 。 实 际 上 ， 除 第 一 次 的 0-1 
次 比较 外 ， 后 面 各 次 比较 中 有 很 多 可 能 在 前 面 已 经 做 过 ， 由 于 这 些 结果 没有 保留 下 来 ， 所 
以 在 以 后 又 重复 进行 。 

树 形 选择 排序 可 克服 这 一 缺点 ， 其 基本 思想 是 : 首先 ，n 个 记录 每 两 个 一 组 ， 比 较 后 
取出 较 小 者 。 如 果 某 组 只 有 一 个 记录 ， 则 轮空 ， 直 接 进 入 下 一 轮 比较 。 这 样 得 到 | n/2 | 个 
较 小 者 ， 然 后 再 两 两 比较 。 如 此 重复 ， 直 至 选 出 最 小 者 为 止 。 这 个 过 程 跟 日 常 很 多 比赛 一 
样 ， 两 两 决胜 负 ， 最 后 决 出 冠军 ， 所 以 有 时 也 形象 地 称 为 锦标 赛 排序 (Tournament Sort )。 

上 述 过 程 可 用 一 棵 完全 二 又 树 来 表示 : 最 抵 屋 和 倒数 第 2 层 的 叶子 代表 待 排序 的 n 个 
记录 的 键 值 ， 叶 子 上 面 一 层 是 叶子 两 两 比较 后 较 小 的 结果 ; 依 此 类 推 ， 最 后 树 根 表 示 选 择 
出 来 的 最 小 关键 字 。 

将 最 小 记录 输出 后 ， 便 完成 了 第 一 趟 选择 。 然 后 在 剩 下 的 叶 结 点 中 ， 可 按 同 样 方法 进 
行 第 二 趋 选择 ， 得 到 新 的 最 小 关键 字 。 注 总 a 到 树 中 记录 看 以 前 比较 的 结果 信息 ， 所 以 在 第 
二 赵 选 择 前 ， 为 了 利用 已 有 结果 以 及 不 破坏 已 有 的 树 结构 ， 可 将 前 一 趋 找 到 的 最 小 叶子 结 
点 的 键 值 改 为 + ， 这 样 重新 比较 时 ， 实 际 上 只 需 修 改 从 树 根 到 了 刚 成 为 ce 的 叶子 结 点 这 条 路 
径 上 各 结 点 的 值 ， 其 他 结 点 保持 不 变 。 由 于 二 又 树 的 深度 为 | log,n |+1， 所 以 最 多 只 需 比 
较 [log,n] 次 ， 而 不 是 m-2 次 了 。 依 次 类 推 ， 经 过 n-1 趟 选择 ， 就 将 记录 按 升序 输出 了 。 

图 7.7 给 出 了 对 关键 字 {68, 15, 45, 52, 07, 53, 14} 进 行 树 形 选 择 排序 的 部 分 过 程 。 


(a) 选 出 最 小 关键 字 07 (b) 选 出 最 小 关键 字 14 (c) 选 出 最 小 关键 字 15 
图 7.7 树 形 选择 排序 的 部 分 过 程 


注意 ， 已 知 叶子 数 n 的 完全 二 又 树 有 两 棵 ， 结 点 总 数 分 别 是 2n-1 和 2n， 其 中 最 底层 
的 叶子 数 分 别 为 偶数 和 奇数 ， 但 后 一 种 在 两 两 比较 时 有 一 个 叶子 轮空 直接 进入 上 一 层 〈( 如 
图 7.7(a) 的 结 点 14)， 故 内 需 考 虑 前 一 种 情况 。 这 时 内 部 结 点 数 为 n-1， 即 天 n-1 场 比赛 。 

可 见 ， 除 第 一 次 需 进 行 n-1 次 比较 外 ， 以 后 每 次 部 最 多 经 过 [logn | 次 比较 就 可 选择 
出 最 小 的 键 值 ， 总 的 比较 次 数 不 超过 -D+=-l)llogn1=Oalogn) 。 由 于 移动 次 数 不 
超过 比较 次 数 ， 所 以 树 形 选 择 排 序 总 的 时 间 复 杂 上 度 为 O(nlog, n)。 

这 种 方法 虽然 减少 了 比较 次 数 ， 但 对 n 个 记录 需要 2n-1 个 存储 单元 ， 即 增加 了 n-1 
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个 结 点 用 于 保存 前 面 比 较 的 结果 ， 并 且 排 序 的 结果 也 需要 另外 存储 。 另 外 ， 与 +ce 的 比较 
实际 上 是 多 余 的 。 

为 了 克服 树 形 选择 排序 的 缺点 ， 威 洛 姆 斯 (JWillioms) 和 弗 洛 伊 德 (Floyd) 在 1964 
年 提出 了 一 种 改进 方法 ， 称 为 堆 排序 (Heap Sort)， 它 是 一 种 巧妙 的 树 形 选 择 排序 ， 不 需 
要 专门 设立 树 。 其 特点 是 ， 将 R[1] 一 Rn] 看 成 是 一 棵 完全 二 又 树 的 顺序 存储 结构 ， 在 排序 
过 程 中 利用 完全 二 又 树 双亲 和 孩子 之 间 的 内 在 关系 来 选择 最 小 (或 最 大 ) 的 记录 。 

首先 ， 引 入 堆 的 定义 。 堆 是 一 棵 完全 二 又 树 ， 其 中 任 一 非 叶 子 结 点 的 关键 字 均 小 于 等 
于 (或 大 于 等 于 ) 其 孩子 结 点 的 关键 字 ”。 另 一 种 常见 的 定义 是 : n 个 关键 字 序 列 Ki, K,, …， 
K, 称 为 堆 ， 当 且 仅 当 该 序列 满足 : 

Ki<K BH Ki<RKonm (<i<|n/2) 
或 者 
kK.>Ks HE>Eo (li<lng) 

这 两 个 定义 本 质 上 是 一 致 的 ， 但 从 堆 的 来 源 和 使 用 上 看 ， 堆 的 树 形 结构 定义 较 好 。 显 
然 ， 堆 中 根 结 点 ( 称 为 堆 顶 ) 的 关键 字 最 小 〈 或 最 大 )， 我 们 称 之 为 小 根 堆 〈 或 大 根 堆 )。 

易 知 ， 有 序 表 为 堆 ， 但 堆 不 一 定 为 有 序 表 。 由 于 堆 中 双亲 和 孩子 间 有 一 定 的 有 序 性 ， 
但 整体 不 一 定 有 序 ， 这 种 有 序 性 有 时 称 为 “ 堆 有 序 ”。 

例如 ， 关 键 字 序 列 “10, 15, 56, 25, 30, 70” 恕 是 一 个 小 根 扒 ， 它 所 对 应 的 完全 二 叉 树 
如 图 7.8 〈a) 所 示 ， 而 图 7.8 (b) 是 一 个 大 根 扒 。 显 然 ， 在 堆 中 任 一 棵 子 树 也 是 堆 。 

堆 排序 正 是 利用 小 根 扒 《或 大 根 堆 ) 来 选取 当前 无 序 区 中 最 小 《或 最 大 ) 的 记录 来 实 
现 排序 的 。 我 们 不 妨 利用 大 根 堆 来 排序 。 首 先 ， 将 初始 无 序 区 调整 为 一 个 大 根 堆 ， 输 出 最 
大 的 堆 顶 记录 后 ， 将 剩 下 的 n-1 个 记录 再 重建 为 堆 ， 于 是 便 得 到 次 大 者 。 如 此 反复 执行 ， 
直到 全 部 元 素 输 出 完 ， 从 而 得 到 一 个 有 序 序列 。 这 个 过 程 就 是 堆 排 序 。 


Co 
10|15|56|25|3ol7o 70|s6|30|25|15|10 
29 (5 (40 
储存 结构 逻辑 结构 储存 结构 
(a) 小 根 堆 示 例 (b) 大 根 堆 示 例 
图 7.8 堆 示 例 


为 了 保证 时 间 性 能 ， 束 要 充分 利用 已 有 结果 ， 即 在 每 次 输出 堆 顶 元 素 后 ， 剩 下 的 元 素 
不 应 该 完全 和 草 新 建 堆 ， 而 应 该 在 原 堆 上 通过 菏 些 调整 得 到 ;为 了 保证 空间 性 能 ， 输 出 的 堆 
项 也 应 该 尽量 利用 原 有 空间 ， 不 难 发 现 可 将 它 与 无 序 区 中 最 后 一 个 记录 交换 位 置 。 这 样 ， 
整个 排序 过 程 中 有 序 区 是 在 原 记 录 区 的 尾部 逐步 形成 并 癌 前 扩大 到 整个 记录 区 的 。 这 里 有 
两 个 问题 震 要 解决 : 

(1) 最 初时 如 何 由 一 个 无 序 序列 建成 一 个 堆 ? 

(2) 在 输出 堆 项 元 素 后 ， 如 何 调整 剩余 元 素 成 为 一 个 新 的 堆 ? 


G 内 存 中 有 块 动态 储存 区 也 叫 “ 堆 ”( 用 于 管理 无 后 进 先 出 特点 的 数据 )， 与 堆 排序 的 堆 毫 无 关系 。 


第 7 章 “ 排 序 Wy. 


先 看 初始 堆 的 建立 ， 即 把 整个 记录 数组 R[1] 一 了 Im] 调整 为 一 个 大 根 堆 。 这 要 求 把 完全 
二 叉 树 中 以 每 一 结 点 为 根 的 子 树 都 调整 为 堆 。 显 然 只 有 一 个 结 点 的 树 是 堆 ， 而 在 完全 二 又 
树 中 , 所 有 序号 这 nm/2 | 的 结 点 都 是 叶子 , 因此 ， 以 这 些 结 点 作为 根 的 子 树 均 已 是 堆 。 这 样 ， 
我 们 只 须 依次 将 以 序号 为 Ln/2j4, Ln2 上 1, …, 1 的 结 点 作为 根 的 子 树 都 调整 为 堆 即 可 。 按 该 
次 序 调 整 每 个 结 点 时 ， 其 左 、 右 子 树 均 已 是 堆 〈 不 妨 将 空 树 办 看 做 是 堆 )。 

于 是 问题 变 为 ， 已 知 结 点 RD] 的 左 、 右 子 树 已 是 堆 ， 如 何 将 以 R[ 为 根 的 完全 二 又 树 
调整 为 堆 ? 解决 这 一 问题 可 采用 “筛选 法 ”。 

盘 选 法 的 基本 思想 是 : 因为 RD] 的 左 、 右 子 树 已 是 堆 ， 这 两 棵 子 树 的 根 分 别 是 各 自 子 
树 中 关键 字 最 大 的 结 点 ， 所 以 ， 我 们 必须 在 RH 和 它 的 左 、 右 孩子 中 选取 关键 字 最 大 的 结 
点 放 到 R[i] 的 位 置 上 。 若 RD 的 关键 字 已 是 三 者 中 的 最 大 者 ， 则 无 须 做 任何 调整 ， 以 Ri 
为 根 的 子 树 已 构成 堆 ; 否则 , 必须 将 及 中 和 具有 最 大 关键 字 的 左 孩 子 R[2i] 或 右 孩 子 R[2i+1] 
进行 交换 。 不 妨 设 R[2i 的 关键 字 最 大 ， 将 了 [和 了 R[2i 交 换 位 置 ， 交 换 之 后 有 可 能 导致 以 
R[2i 为 根 的 子 树 不 再 是 堆 ， 但 由 于 R[2i] 的 左 、 右 子 树 仍 然 是 堆 ， 于 是 可 重复 上 述 过 程 ， 将 
以 R[21] 为 根 的 子 树 调整 为 堆 ，…… ， 如 此 逐 层 递 推 下 去 ， 最 多 可 能 一 直 调 整 到 树叶 。 这 一 
过 程 就 像 过 划 子 一 样 ， 把 较 小 的 关键 字 角 下 去 ， 而 将 最 大 关键 字 一 层 层 地 选择 上 来 。 

图 7.9 表示 了 对 关键 字 序 列 : 49, 38, 49' 91, 27, 03, 97. 49"， 在 建 堆 过 程 中 完全 二 叉 树 
的 变化 情况 ， 其 中 n=8， 故 从 第 4 个 结 点 开始 进行 调整 。 


(d) i=1，49 得 下 一 层 (e) 建成 的 堆 
图 7.9 建 堆 过 程 示 例 


饥 选 算法 如 下 : 
void Sift(1ist R,int p,int q) {V// 堆 范围 为 R[p] ~R[d] ， 调 整 R[p] 为 堆 ， 非 递归 算法 
int i,j; 
R[0]=R[p]; //R[I0] 作 辅助 量 ， 保 存 原 根 结 点 
i=p; /Vi 指 问 竺 调整 点 
j=2*i; //j 指 问 RI[i] 的 左 孩 子 


while(J]<=q) { 
if(j<q && R[j] .key<R[j+1] .key) j++;//j 指 回 RIi] 的 右 孩 子 


if (R[0] .key>=R[j] .key) break: // 根 结 点 大 于 孩子 ， 已 经 是 堆 ， 调 整 结束 
R[i]=R[j]; // 将 R[j] 换 到 双亲 位 置 上 

i=j; // 修 改 当 前 锌 调整 结 皮 

j=2*i; //j 指 问 R[i] 的 左 孩 子 
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R[i]=R[0]; // 原 根 结 点 放 入 正确 位 置 

} 

其 中 , 被 调整 结 点 RH 和 它 的 某 个 孩子 RD] 交 换 时 , 仅 将 Rj 放 入 了 RH] 的 位 置 ， 而 原 
R[1] 并 没有 放 入 到 RD] 的 位 置 , 这 是 因为 它 在 该 位 置 还 可 能 会 被 继续 蜂 选 下 去 ,为 了 减少 记 
录 的 移动 次 数 ， 只 有 当 整 个 师 选 过 程 结 束 时 ， 才 将 它 放 到 最 终 位 置 〈 这 点 类 似 前 述 快速 排 


序 的 划分 算法 )。 
另外 ， 在 完全 二 又 树 中 ， 大 一 个 结 点 没有 左 孩 子 ， 则 该 结 点 必 是 叶子 ， 因 此 上 面 算 法 


中 的 条 件 ] 三 qg， 即 2i1<q 不 成 立时 ， 表 示 当 前 调整 结 点 及 [jj 已 是 叶子 ， 故 般 选 过 程 结 束 。 

由 于 筛选 过 程 的 递归 性 ， 也 容易 写 出 相应 的 递归 算法 ， 但 这 时 符 调 整 结 点 RD] 在 中 途 
交换 中 每 次 都 要 真正 移动 ， 故 移动 次 数 比 上 述 非 递归 形式 多 ， 具 体 算法 略 。 

建 堆 后 R[1] 是 关键 字 最 大 的 记录 ， 而 排序 后 它 应 该 是 记录 区 R[] 一 了 人] 的 最 后 一 个 记 
录 ， 因 此 ， 将 R[1] 和 R[n] 交 换 后 便 得 到 了 第 一 趋 排序 的 结果 。 

第 二 趟 排序 时 , 首先 将 当前 无 序 区 RT1] 一 R[n-1] 调 整 为 堆 。 因 为 第 一 趟 排序 后 ,R[1] 一 
Rn-1] 中 只 有 RUI] 的 值 发 生 了 变化 ， 它 的 左 、 右 子 树 仍 然 是 堆 ， 所 以 ， 这 个 调整 过 程 可 以 
调用 筛选 算法 Sift(R, 1,n-1)。 然 后 ， 将 堆 顶 记录 R[1] 和 当前 无 序 区 的 最 后 一 个 记录 R[n-1] 
交换 ， 结 果 R[1] 一 R[n-2] 变 为 新 的 无 序 区 ，R[n-1] 一 了 R[Im 为 有 序 区 。 如 此 重复 n-1 趟 排序 之 
后 ， 束 使 有 序 区 扩充 到 整个 记录 区 R[1] 一 了 R[m]。 

图 7.10 是 堆 排 序 的 全 过 程 示 例 ， 其 中 虚线 下 的 结 点 表示 已 排 好 序 的 记录 ， 最 后 一 步 即 
子 图 (n) 时 ， 堆 中 只 有 一 个 结 点 ， 排 序 结 束 。 

最 后 ， 堆 排序 算法 如 下 : 


void HeapSort (list R,int n) { // 对 RI[1]~R[n] 进 行 堆 排 序 


下 而 下 了 
for (1i=n/2;1>=1;1i--) Sift (R,i,n); // 建 初始 堆 
Fo 一 了 // 进 行 n-1 趟 堆 排 序 
R[0]=R[1] ;R[1]=R[i];R[i]=R[0]; // 堆 项 和 当前 堆 底 交换 ，R[I0] 作 辅助 量 
SEE e // 将 RI1L1]~RIi-1] 重 建 堆 
} 
} 
堆 排 序 的 时 间 ， 主 要 由 建 初 始 堆 和 不 断 重 建 堆 这 两 部 分 的 时 间 开 销 构成 。 建 初始 堆 时 
从 下 往 上 分 别 把 各 层 结 点 对 应 的 子 树 调用 Sift 过 程 调 整 为 堆 。 当 堆 为 满 二 叉 树 时 ， 设 深度 
为 h( 结 点 数 n=2"1)， 第 i 层 结 点 (有 2 个 ) 最 多 下 调 到 第 h 层 ， 下 调 hi 次 ， 在 Sif 


过 程 中 关键 学 比 较 次 数 至 多 为 下 调 次 数 的 2 倍 ， 故 关键 字 比 较 次 数 最 多 为 
co=2》 271(h -i)=2| 2 x1+2 3x2+-…2° x(h—1)| 


1=h—l1 
=2|2* —(h+1)| 
=2[(m+1)—-(h+1)|=2[n—h]<2n 
当 扒 不 是 满 二 叉 树 时 ， 相 当 于 在 上 述 基础 上 hr+l 层 的 左 侧 增 加 x 个 叶子 (这 时 
n=2" 1+x)， 则 它们 的 祖先 结 点 对 应 的 子 树 高 度 增 1， 相 应 的 下 调 次 数 最 多 增加 1 次 。 可 证 
这 些 祖先 数 和 <x+h， 所 以 总 的 关键 字 比 较 次 数 不 超 过 
ci)=C)+2A<2|2-(h+D|+2[G+bl=2[a+l-x-h-D+Gx+h=2n 
可 见 不 论 堆 形 态 如 何 ， 建 堆 时 关键 字 比 较 次 数 都 不 超过 2n， 其 复杂 性 为 OOn)。 
男 可 证 明 ， 建 堆 时 平均 比较 次 数 约 为 1.88n《〈 很 接近 最 坏 情 况 )。 


(g) 重建 的 堆 R[1] 到 R[5] (Ch) 第 四 趟 排序 后 


四 @c、 
国 2B ® 名 


J 二 # 和 
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(j) 第 五 趟 排序 后 (k) 重建 的 堆 R[1] 到 R[3] (1) 第 六 趟 排序 后 
mm CT 
ee 

3 Ba @ (9 
过 
(m) 重建 的 堆 RI1] 到 R[2] (n) 第 七 趟 排序 后 


图 7.10 堆 排 序 过 程 示 例 
第 ] 次 重建 堆 时 ， 挫 中 有 nj 个 结 点 ， 完全 二 又 树 深度 为 | log,(n 一 j))|+1， 调用 Sift 
重建 堆 历 需 的 比较 次 数 全 多 为 2x|logx -jj|。 因 此 ，n-1 站 排序 过 程 中 重建 推 的 比较 总 
C,(n) = 号 ?log， oa-j)| 


< 2x[log,(n—1)+log,(n—2)+:…+log,2+log,!1| 
=2log, (n—1)! 

22[(n— Dlog,(n—1)—1.S5(n—1)| 

~ 2nlog,n — 3n = O(nlog,n) 
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在 上 述 Sift 算法 中 ， 记 录 的 移动 次 数 不 会 超过 比较 次 数 ， 因 此 ， 堆 排序 的 最 坏 时 间 复 
杂 度 是 O(n)+Oln log,n) = O(nlog,n)。 堆 排 序 的 平均 性 能 分 析 较 难 ， 但 结果 表明 它 较 接近 
于 最 坏 性 能 ， 即 O(nlog,n) 。 

堆 排 序 需要 的 辅助 空间 为 1， 用 于 交换 记录 ， 在 上 述 复 法 中 用 R[0] 代 玲 。 

堆 排序 中 ， 记 录 有 路 越 交 换 《〈 筛 选 以 及 将 堆 顶 与 无 序 区 最 后 位 置 交 换 )， 可 能 改变 键 
值 相同 记录 的 相对 位 置 ， 故 是 不 稳定 的 (但 锦标 赛 排 序 是 稳定 的 )。 

上 述 堆 排 序 算法 还 可 改进 。 比 如 ， 和 重建 堆 时 因 堆 抵 相 对 较 小 (或 较 大 ) ， 把 它 交 换 到 
堆 项 ， 显 得 “提升 ”过 多 ， 以 后 必然 “降级 ” 较 多 ， 产 生 较 多 的 比较 和 交换 次 数 。 对 此 看 
手 改进 能 使 算法 的 最 坏 复 杂 性 从 2n logn 左右 降低 到 nlog,n 左右 〈 平 均 性 能 接近 最 坏 性 
能 ) ， 具 体 算法 略 。 

另外 ， 建 堆 过 程 也 可 以 在 已 有 扒 尾 部 不 断 添加 〈 插 入 ) 新 结 点 ， 将 新 结 点 与 双亲 、 双 
亲 的 双亲 ， 和 直到 根 进行 比较 来 调整 其 位 置 ( 见 习题 7.19) 。 该 过 程 比较 次 数 可 能 较 多 ， 但 
这 种 从 下 到 上 调整 的 思想 在 树 形 选择 排序 〈 包 括 后 面 外 排序 中 的 败 者 树 ) 中 经 常用 到 。 前 
述 Sift 过 程 则 是 从 上 到 下 的 调整 过 程 。 

不 难 想象 ,把 堆 排 序 的 二 又 树 推 广 到 多 又 树 , 算法 也 是 可 行 的 ， 这 时 比较 次 数 在 增加 ， 
而 移动 次 数 在 减少 ， 有 研究 表明 ，4 一 6 又 树 较 好 ， 总 的 时 间 可 以 节省 20% 一 309% 左 右 。 


Cs 归并 排序 


归并 排序 (Merging Sort) 是 利用 “归并 ”技术 来 进行 排序 ， 所 谓 归 并 是 指 将 右 干 个 已 
排序 的 子 表 合 并 成 一 个 有 序 表 。 

最 简单 的 归并 是 将 两 个 有 序 的 子 表 合并 成 一 个 有 序 表 。 假 设 RIlow] 一 人 [mid] 和 
R[Imid+l1] 一 人 [high] 是 存储 在 同一 个 数组 中 且 相 邻 的 两 个 有 序 的 子 表 ， 要 将 它们 合并 为 一 个 
有 序 表 Ri[low] 一 Ri[highl]， 只 要 设置 3 个 指示 器 1、] 和 k， 其 初 值 分 别 是 这 3 个 记录 区 的 
起 始 位置 。 合 并 时 依次 比较 RD 和 了 RD] 的 关键 字 ， 取 关键 字 较 小 的 记录 复制 到 R[k] 中 ， 然 
后 ， 将 指 回 被 复制 记录 的 指示 露 和 指 癌 复制 位 置 的 指示 堪 k 分 别 加 1， 重 复 这 一 过 程 ， 下 
至 全 部 记录 被 复制 入 Ri[low] 一 Ri[high] 中 为 止 。 其 算法 如 下 : 

Vold Merge (list R,1ist R1,Int low,int mid,int high) { 

// 合 并 RR 的 两 个 子 表 : R[low]~R[mid]、R[mid+1]~R[high]， 结 果 在 Rl1 中 

人 
1=]ow; 
J]=mid+1; 
k=1ow; 
while (1i1<=mid && J]J<=high) 
if (R[i] .key<=R[j] .key) Rl1[k++]=R[i++]; // 取 小 者 复制 
else Rl1[k++]=R[J++]; 
while(1i<=mid) Rl1[k++]=R[1++]; // 复 制 左 子 表 的 剩余 记录 
while(jJ<=high) Rl1[k++]=R[jJ++]; // 复 制 右 子 表 的 剩余 记录 
} 


归并 排序 就 是 利用 上 述 归并 操作 实现 排序 的 , 其 基本 思想 是 : 开始 时 , 将 数据 表 R[]] 一 
R[n] 看 成 n 个 长 度 为 1 的 有 序 子 表 ， 把 这 些 子 表 两 两 归并 ， 便 得 到 | mn/2 | 个 有 序 的 子 表 ( 当 
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n 为 奇数 时 ， 归 并 后 仍 有 一 个 长 度 为 1 的 子 表 ); 然后 ， 再 把 这 [n/2] 个 有 序 子 表 两 两 归并 ， 
如 此 反复 ， 直 到 最 后 得 到 一 个 长 度 为 n 的 有 序 表 为 止 。 上 述 归 并 操作 ， 每 次 都 是 将 两 个 子 
表 合 并 成 一 个 子 表 ,这 种 方法 称 为 “二 路 归并 排序 ”。 类 似 地 也 可 以 有 “三 路 归并 排序 ”或 
“多 路 归并 排序 ”。 二 路 归并 排序 的 全 过 程 如 图 7.11 所 示 ， 其 中 方 括号 表示 有 序 子 表 。 
初始 关键 字 49 38 49' 91 27 03 97 49” 
初始 子 表 [49] [38] [49] [91] [27] [03] [97] [49"] 
-一 一 一 一 / 一 一 / 一 "一 


第 一 趟 归并 后 [ 38 49] [49" 91] [03 27] [49” 97] 
sd 


i 
第 二 趟 归并 后 [38 49 49' 91] [03 27 49"” 97] 
机 


第 三 趟 归并 后 [03 27 38 49 49' 49" 91 97 ] 
图 7.11 二 路 归并 排序 示例 


在 给 出 二 路 归并 排序 算法 之 前 ， 必 须 先 解决 一 趟 归并 问题 。 在 一 趟 归并 中 ， 设 各 子 表 
长 度 为 len (最 后 一 个 子 表 长 度 可 能 小 于 len)， 则 归并 前 RII] 一 R[m] 共 有 | mn/len | 个 有 序 的 
子 表 : R[1] 一 R[len]、RIlen+1] 一 人 [2xlen]、…、R[( mlen -1Dxlen+l1] 一 Rn， 调用 归并 操作 
Merge 将 相 邻 的 一 对 子 表 进 行 归并 时 ， 可 能 最 后 单独 剩 一 个 子 表 〈 子 表 个 数 为 奇数 )、 或 最 
后 两 个 子 表 中 后 一 个 长 度 小 于 len， 这 两 种 情况 要 特殊 处 理 。 一 趋 归并 算法 如 下 : 

void MergePass (list R,list Rl,int n,int len) {// 对 RR 做 一 趟 归并 ， 结 果 在 R1 中 

Li 1 

11 //i 指 问 第 一 对 子 表 的 起 始点 

while (i+2*len-1<=n) { // 归 并 长 度 为 len 的 两 个 子 表 
Merge (R,R1,1,1i+len—l1,1+2*len—1); 


i=i+2*len; //i 指 问 下 一 对 子 表 起 始点 

} 

if (i+len-l<n) // 最 后 剩 两 个 子 表 ， 后 一 个 长 度 小 于 len 
Merge (R,R1,1I,1I+len-1,n) :; 

else // 最 后 剩 一 个 子 表 〈 子 表 个 数 为 奇数 ) 
for (j=i;j<=n;j++) // 将 最 后 一 个 子 表 复 制 到 R1 中 


R1[J]=R[J]; 
} 


二 路 归并 排序 就 是 反复 调用 一 趟 归并 ， 将 数据 表 进 行 若干 趟 归并 ， 每 趟 归并 后 有 序 子 


表 的 长 度 len 扩大 一 倍 。 第 一 趟 归并 时 ， 有 序 子 表 的 长 上 度 len 为 1， 当 有 序 段 长 度 len>n 


时 排序 完成 。 二 路 归并 算法 如 下 : 
void MergeSort (list R,list Rl,int n) {// 对 R 二 路 归并 排序 ， 结 果 在 R 中 ( 非 递归 算法 ) 


int len; 
len=1; 
while (len<n) 1{ 
MergePass (R,R]1,n, 1en) ;len=len*2; // 奇 趟 归并 ， 结 果 在 R1 中 
MergePass (R1,R,n,1en) ;len=len*2; // 偶 赵 归 并， 结果 在 RR 中 
} 
} 


其 中 分 奇 趋 和 侦 赵 归并 是 为 了 交替 使 用 R1 和 及 作 辅 助 空间 。 本 来 偶 趟 归并 时 要 判断 
是 否 len=n, 有 是 则 排序 实际 已 完成 ,但 结果 在 及 1 中 ,这 时 再 执行 偶 趟 归并 时 , 因 MergePass 
函数 中 while 和 站 条 件 都 不 满足 ， 结 果 只 执行 了 最 后 和 面 的 复制 语句 ， 正 好 将 R1 中 的 数据 
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复制 到 及 中 。 

显然 ， 第 i 趟 归并 后 ， 有 序 子 表 长 度 为 2， 因此， 对 于 具有 nm 个 记录 的 数据 表 ， 必 须 
做 [logn | 趟 归并。 每 趟 归并 时 ， 每 比较 一 次 怠 有 一 个 记录 移动 ， 但 可 能 茶 个 子 区 间 先 移 
动 完 ， 这 时 另 一 个 子 区 间 的 剩余 记录 就 不 必 比 较 了 ， 即 记录 比较 次 数 不 超 过 移动 次 数 ， 而 
记录 移动 次 数 为 n， 从 而 每 趋 归 并 所 花 的 时 间 是 O(n)。 所 以 ， 二 路 归并 排序 算法 的 时 间 复 
末 度 最 好 和 最 坏 都 为 O(nlog,n)。 

算法 中 的 辅助 空间 为 数组 R1， 所 需 的 空间 是 O(n)， 大 于 前 面 介绍 的 其 他 排序 方法 (但 
比较 次 数 少 )。 

二 路 归并 中 ， 帮 两 个 有 序 子 表 中 存在 键 值 相同 的 记录 ， 则 前 一 个 子 表 中 的 记录 先 复制 
( 知 有 多 个 则 依次 复制 )， 即 不 会 改变 这 些 记 录 的 相对 位 置 ， 故 是 稳定 的 。 

需要 指出 的 是 ， 二 路 归并 实际 上 并 不 需要 从 单个 记录 开始 进行 两 两 归并 ， 通 常 可 以 先 
利用 直接 插入 排序 求 得 较 长 的 有 序 子 表 ， 然 后 再 两 两 归并 。 因 为 直接 插入 排序 是 稳定 的 ， 
这 种 改进 后 的 归并 排序 仍然 是 稳定 的 。 

以 上 算法 是 目 底 同上 进行 的 , 区 间 不 断 合 并 而 增 大 。 二 路 归并 排序 也 可 目 顶 癌 下 进行 ， 
区 间 不 断 分 割 而 变 小 ; 先 分 成 两 部 分 R[1] 一 人 RIrmidl]、R[mid+l1] 一 了 [high]， 分 别 排序 得 两 个 
有 序 区 间 ， 再 将 两 者 归并 。 而 前 后 两 部 分 的 排序 用 同样 的 方法 : 各 目 又 分 成 前 后 两 部 分 ， 
分 别 排 序 ， 再 归并 。 这 是 一 种 “分 治 法 ”， 很 容易 用 递归 实现 (与 快速 排序 相 比 ， 这 里 “分 ” 
容易 ， 而 “ 合 ” 较 难 )， 其 时 间 复 杂 度 与 非 北 归 算法 相当 。 但 递归 时 不 能 交 蔡 使 用 Rl1 和 及 
作 辅 助 空间 ，Merge 归并 后 的 结果 仍 要 在 原 R 中 ， 这 需要 在 归并 前 将 数据 从 R 复制 到 RI1 
中 (或 归并 后 将 数据 从 Rl 复制 到 及 中 )， 再 加 上 递归 栈 引 起 的 附加 时 空 开 销 ， 使 得 递归 算 
法 的 实际 执行 效率 党 不 及 非 递 归 算 法 〈 但 算法 简洁 些 )， 有 具体 略 〈 见 习题 7.18 )。 
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表面 押 讨 论 的 排序 算法 都 是 基于 关键 字 之 间 的 比较 ， 通 过 比较 判断 出 谁 大 谁 小 ， 然 后 
进行 调整 。 分 配 排 序 则 不 然 ， 它 是 利用 关键 学 的 结构 ， 通 过 “分 配 ” 和 “收集 ”的 办 法 来 
实现 排序 的 ， 排 序 过 程 中 无 须 比 较 关 键 字 。 分 配 排序 可 分 为 箱 排序 和 基数 排序 两 类 。 

箱 排 序 (Bin Sort) 也 称 桶 排序 (Bucket Sort)， 其 基本 思想 是 : 设置 若干 个 箱子 ， 依 
次 扫 摘 竺 排序 的 记录 R[1]、R[2]、…、Rm]， 把 关键 字 等 于 k 的 记录 全 都 逆 入 到 第 k 个 箱 
子 〈 分 配 )， 然 后 ， 按 序号 依次 将 各 非 空 的 箱子 首尾 连接 起 来 〈 收 集 )。 例 如 ， 要 将 一 副 混 
洗 的 52 张 扑 死 牌 按 面 值 A<2<…<J<Q<K 排序 (不 分 花色 )， 需 设置 13 个 “箱子 ”， 排 序 时 
依次 将 每 张 牌 按 面 值 放 入 相应 的 箱子 里 ， 然 后 依次 将 这 些 箱 子 首 尾 相 接 ， 了 怠 得 到 了 按 面值 
递增 序 排 列 的 一 副 牌 。 

显然 ， 在 箱 排序 中 ， 箱 子 的 个 数 m 取决 于 关键 字 的 取 值 范围 。 在 排序 中 分 配 的 时 间 是 
On， 收集 的 时 间 为 O(m+n)( 硅 用 链表 存储 等 排 记 录 ， 则 收集 的 时 间 为 O(m));， 所 以 箱 排 
序 的 时 间 为 On+tn)。 若 关键 字 的 取 值 范围 很 大 ， 如 m=O(n”)， 则 箱 排 序 效率 很 低 。 

基数 排序 (Radix Sort) 是 对 箱 排 序 的 改进 和 推广 。 箱 排序 只 适用 于 关键 字 取 值 范围 较 
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小 的 情况 。 否 则 ， 所 需 箱子 的 个 数 m 以 及 清 箱 和 连接 箱子 的 时 间 均 太 多 。 如 果 注 意 到 关键 
字 的 结构 特点 ， 就 可 使 这 一 问题 大 为 改观 。 

例如 ， 对 前 述 数据 表 49, 38, 49' 91, 27, 03, 97, 49"， n=8， 由 于 关键 字 k 由 两 位 数组 成 ， 
所 以 ， 我 们 可 将 其 分 解 ， 先 按 个 位 数 〈 由 kio%10 得 到 ) 进行 箱 排序 ， 然 后 再 按 十 位 数 〈 由 
ki/10 得 到 ) 进行 箱 排序 ， 这 样 只 需 标 号 为 0, 1 …, 9 的 10 个 箱子 ， 而 不 是 0 到 99 的 100 
个 箱子 ! 第 一 趟 箱 排序 时 ， 先 将 顺序 扫描 到 的 记录 按 关键 字 的 个 位 数 装 箱 ， 即 把 49 装 入 9 
号 箱 、38 装 入 8 号 箱 、……- 、49" 装 入 9 号 箱 ， 其 结果 如 图 7.12 (a) 行 所 示 ; 然后 依 箱 号 
递增 顺序 将 各 非 空 箱 首尾 相连 即 得 第 一 趟 排序 结果 : 

vl: WD 717, 97, 8 95 dO" 

显然 这 一 序列 已 按 个 位 有 序 。 

第 二 趟 箱 排 序 前 需 先 清空 各 箱子 ， 然 后 ， 顺 序 扫 摘 第 一 趟 的 结果 ， 并 将 扫 到 的 记录 按 
关键 字 的 十 位 数 装 箱 〈 大 无 十 位 数 则 将 十 位 数 看 作 零 )。 其 结果 如 图 7.12 (b) 行 所 示 ， 把 
非 空 箱 连 接 后 即 得 到 最 终 的 有 序 序 列 : 

03，27，38，49，49'"，49"% 91，97 

因为 箱子 个 数 m 的 数量 级 不 大 于 O(n)， 所 以 ， 上 述 排序 的 时 间 复 杂 度 是 O(n)。 


mppb hh hn 
my | | | [sl | | [7 |w | 
my [wm | [7 lw ow) | | | Jw” 


图 7.12 两 次 装 箱 〈 分 配 ) 


一 般 地 ， 将 数据 表 中 各 记录 R 的 关键 字 看 成 一 个 d 元 组 (ki', ki?,…, ki )， 每 个 分 量 
的 取 值 范围 相同 C1 万 ki 志 C. (1 科 j 科 d)， 可 能 取 值 的 个 数 r 称 为 基数 。 基 数 的 选择 和 关键 
字 的 分 解 视 关键 字 的 类 型 而 异 , 如 关键 字 是 十 进 制 整数 , 则 可 取 基 数 为 于 10、Ci=0、Cio=9， 
d 为 关键 字 的 最 大 位 数 。 若 关键 字 是 由 小 写 英 文字 母 组 成 的 字符 串 ， 则 可 取 天 26、Ci=a 
C26=Z，d 为 字符 串 的 最 大 长 度 。 

基数 排序 的 基本 思想 是 : 从 低 到 高 依次 按 关 键 字 的 各 分 量 进行 箱 排序 ， 即 首先 按 li 
进行 箱 排序 ， 再 按 k*! 进行 箱 排序 ，……: ， 最 后 按 ki 进行 箱 排序 (11 万 n)。 每 趟 箱 排 序 
所 需 箱子 的 个 数 就 是 基数 r。 显 然 ， 这 个 过 程 相当 于 对 多 关键 学 进行 LSD 排序 。 

图 7.12 所 示 的 例子 ， 就 是 一 个 基数 r=10、 分 量 数 d=2 的 基数 排序 。 

注意 ， 由 于 每 趟 排序 的 箱子 是 共用 的 ， 所 以 除 第 一 趟 外 ， 其 他 每 趟 排序 前 要 先 清空 各 
箱子 。 另 外 ,每 个 箱子 内 的 数据 在 装 箱 和 收集 时 的 顺序 应 该 相同 ,否则 排序 结果 会 不 正确 。 
例如 ， 图 7.12 第 二 次 装 箱 时 ， 第 9 号 箱子 的 两 个 数据 中 91 先 于 97 装 箱 ， 在 取出 时 车 先 取 
97 再 取 91， 结 果 就 错 了 。 所 以 每 个 箱子 的 数据 应 按 先进 先 出 的 原则 ， 即 按 队列 存放 。 

由 于 每 个 箱子 所 装 数据 的 个 数 是 可 变 的 ， 适 合用 链表 来 装 箱 ， 所 以 每 个 箱子 应 设计 成 
一 个 链 队 列 。 下 面 用 静态 链表 作为 数据 表 的 存储 结构 ， 并 且 不 另 设 各 链 队 列 的 结 点 空间 ， 
而 利用 静态 链表 中 的 结 点 作为 链 队列 中 的 结 点 ， 这 样 只 需 修 改 指针 即 可 完成 分 配 〈 装 箱 ) 
和 收集 (连接 箱子 ) 的 任务 ， 故 又 称 这 种 排序 为 链 式 基数 排序 。 

与 基数 排序 有 关 的 类 型 定义 、 变 量 说 明 以 及 算法 如 下 : 
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corngt 1nEl G3 / /假设 分 量 数 为 3 
const int r=10; // 假 设 基数 为 10， 也 即 箱 子 个 数 
typedef struct { 


int f,e; // 队 列 的 头 、 尾 指针 
} gqueue; // 队 列 类 型 


typedef int datatype; 

typedef struct { 
datatype key[d]; // 关 键 字 由 ad 个 分 量 组 成 
othertype other; // 记 录 的 其 他 域 


int nexts / /静态 链 域 
} TeCEYypes // 记 录 结 点 类 型 


int RadixSort (rectype RI[],int n) { 
// 对 RI[0] ~R[n-1] 基 数 排序 ， 返 回收 集 链表 的 头 指 针 
1 Rg FY 


queue BI[r]; //r 个 链 队 列 ， 每 个 都 是 一 个 箱子 
for (i=0;i<n-—1;i++) // 将 R[0]~R[n-1] 链 成 一 个 静态 链表 
R[1] .next=1+1; 
R[n-1] .next=-1; // 将 初始 链表 的 终端 结 点 指针 置 空 
p=0; / /Pp 指 问 链表 的 第 一 个 结 点 
for (]=dq-17]>=07]--) { / /进行 d 趟 箱 排序 
for (i=0;i<r;i++) / /清空 箱子 
BI[1] .f=B[i] .e=-1; 
while(p!=-1) { / /扫描 链表 ， 分 箱 
k=R[p] .key[j]; // 按 第 j 个 分 量 分 配 ，k 为 箱子 号 


if(B[k] .f==-1) BI[K] .f=p;//BI[K] 为 空 箱 ,将 R[p] 链 到 箱 头 
else RI[B[k] .e] .next=p;// 将 RI[p] 链 到 箱 尾 


B [k] .e=p; // 修 改 箱子 的 尾 指针 
p=R[p] .next; // 扫 摘 下 一 个 记录 
} 
1=0; 
while (B[i] .f==-1) i++; // 找 第 一 个 非 空 的 箱子 
p=B[i].f; / /Pp 为 收集 链表 的 头 指针 
t=B[I] .e; 
whlle(I<Fr-1) { 
i++; // 取 下 一 个 箱子 
TF / /连接 非 空 箱 
R [七 ] .next=B[1i].f; 
t=B[i] .e; 
} 
} 
RI[t] .next=-—1; // 本 趟 收集 完毕 ， 将 链表 的 终端 结 点 指针 置 空 


} 


return p; 


} 


排序 结束 后 ， 结 果 仍 在 数组 R 中 ， 指 针 p 指明 排序 后 第 一 个 记录 的 下 标 。 例 如 ， 对 前 
述 取 值 范围 为 0 至 99 之 间 的 一 组 关键 字 序列 : 49, 38, 49' 91, 27, 03, 97, 49"， 执 行 算 法 
RadixSort， 基 数 上 10、Ci=0、C2=9、d=2， 其 排序 过 程 如 图 7.13 所 示 。 


B[O]f 


BlOl.e 


B[O]f 
! 


BlOl.e 
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p 一 "98 一 省 9 上 91 一 27 上 0 一 7 一 9 


B[1].f 
J 


B[1].e 


B[2]f 


B[2].e 


(a) 初始 状态 
Bl3]f BI4f  BI5lf Blelf BFlf Bl8alf Bl9]f 


， + ， + 
} 
1 


B[3]e Bl4le Bl5le Blele Bl[le Bl8le Bf9].e 


(b) 第 一 趟 分 配 《〈 按 个 位 装 箱 ) 后 的 状态 


p 一 1 一 | 一 尼 7 上 7 一 一 省 9 一 se 一 9"| 


B[1].f 


B[1].e 


B[2]+f 


B[2].e 


(c) 第 一 趟 收集 后 ， 已 按 个 位 有 序 
BI3]f  B[4]f  B[5]f Ble]f Br]f Bal]f Bf9]#f 
| 


， * 
， ， 


B[3]e Bl4le Bl5le Blele Br]le Bl8le Bf9].e 
(d) 第 二 趟 分 配 〈 按 十 位 装 箱 ) 后 的 状态 


p 一 0 一 7 一 8 一 9 一 ee 一 一 7 


(e) 第 二 趟 收集 后 ， 已 按 十 位 和 个 位 有 序 
图 7.13 基数 排序 示例 


在 上 述 算法 中 ， 没 有 关键 字 的 比较 和 记录 的 移动 ， 只 是 扫描 链表 和 进行 指针 赋值 ， 所 
以 排序 的 时 间 主 要 耗费 在 修改 指针 上 。 其 中 ， 将 R 初始 化 成 一 个 静态 链表 的 时 间 是 OOn); 
在 每 趟 箱 排序 中 ， 清 箱 时 间 是 O(r)， 分 配 时 将 n 个 记录 装 入 箱子 ， 时 间 是 O(n)， 收 集 的 时 
间 是 OOD。 因 此 ， 一 直 箱 排序 的 时 间 复 杂 度 是 O(rtn)。 因 为 要 进行 d 趟 箱 排 序 ， 所 以 链 式 
基数 排序 的 时 间 复 杂 度 是 O(dx(rtn))xO(dxn)， 若 d 为 常数 ， 则 时 间 复 杂 度 为 O(n) “。 

但 要 注意 ， 当 n 较 小 ，d 较 大 时 ， 基 数 排序 并 不 一 定 合适 。 只 有 当 m 较 大 、d 较 小 时 ， 
特别 是 记录 的 信息 量 较 大 时 ， 基 数 排序 最 为 有 效 。 

基数 排序 中 ， 每 一 个 记录 中 增加 了 一 个 next 域 ， 每 个 箱子 增加 了 一 个 头 尾 指 针 (B 数 
组 )， 故 辅助 存储 空间 开销 为 O(n+r)。 

基数 排序 在 分 配 和 收集 时 不 会 改变 相同 键 值 记 录 的 相对 位 置 ， 故 是 稳定 的 。 


@ 但 车 n 个 数据 不 重复 ， 则 所 需 位 数 至 少 为 4=[log na] ， 这 时 复杂 性 oOaxd=Oaflog n]) ， 即 仍 是 


O(nlog, n)。 
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C7 内 部 排序 方法 的 比较 和 选择 


由 于 排序 在 计算 机 中 所 处 的 重要 地 位 ， 以 及 不 同 场合 对 排序 的 特定 要 求 ， 人 们 研究 出 
了 众多 的 排序 方法 。 本 章 前 面 介 绍 的 几 种 排序 方法 ， 上 只 是 已 有 算法 中 为 数 很 少 的 几 个 。 各 
种 排序 方法 都 有 其 各 目的 优 缺 点 ， 应 该 说 没有 哪个 是 绝对 最 好 的 。 一 般 说 来 ， 比 较 简 单 的 
排序 〈 如 直接 插入 、 直 接 选 择 、 冒 泡 排序 等 ， 一 般 称 为 简单 排序 ) 每 次 只 对 相 邻 的 元 素 比 
较 ， 前 进步 伐 慢 ， 时 间 耗 费 大 ， 时 间 复 杂 度 为 Oo)， 但 在 一 些 特殊 情况 下 却 可 取得 很 好 的 
效果 ; 效率 高 的 算法 每 次 比较 产生 的 作用 不 仅仅 局 限于 被 比较 的 两 个 元 素 ， 而 是 多 个 甚至 
一 半 左 右 的 元 素 ， 但 它们 对 数据 量 小 的 情况 并 不 一 定 合适 。 

在 实际 中 如 何 进行 选取 呢 ? 一 般 要 综合 考虑 下 列 因 素 : 

(1) 竺 排序 的 记录 数目 。 

(2) 记录 本 喘 信息 量 的 大 小 。 

(3) 关键 字 的 结构 及 其 分 布 情况 。 

(4) 对 排序 稳定 性 的 要 求 。 

(5) 语言 工具 的 条 件 。 

(6) 算法 本 喘 的 难 易 程度 。 

(7) 辅助 空间 的 大 小 等 。 

依据 这 些 因 素 ， 可 得 出 如 下 几 点 结论 : 

(1) 者 na 较 小 (如 n<S0)， 可 采用 一 些 比较 简单 的 排序 方法 ， 如 直接 插入 排序 或 直接 
选择 排序 。 在 这 两 者 中 ， 当 记录 本 身 信息 量 较 大 时 ， 宜 选用 直接 选择 排序 ， 因 为 它 押 需 记 
录 移 动 次 数 较 少 ; 人 否则 可 用 直接 插入 排序 ， 它 一 般 比 直接 选择 排序 略 快 。 

(2) 右 m 较 大 ， 且 键 值 分 布 没 有 规律 ， 应 采用 一 些 时 间 开 销 比较 小 的 排序 方法 ， 如 快 
速 排 序 、 扒 排序 或 归并 排序 ， 它 们 的 时 间 复 杂 上 度 一 般 为 OAalog,n) 。 人 快速 排序 被 认 为 是 目 
前 基于 比较 的 内 部 排序 中 最 好 的 方法 ， 当 竺 排序 的 关键 字 是 随机 分 布 时 ， 快 速 排序 的 平均 
时 间 最 短 ; 但 扒 排 序 押 需 的 辅助 空间 少 于 快速 排序 ， 并 且 不 会 出 现 快速 排序 可 能 出 现 的 最 
坏 情况 。 这 两 种 排序 都 是 不 稳定 的 ， 奋 要 求 排序 稳定 ， 则 可 选用 归并 排序 ， 但 它 押 需 的 畏 

空间 最 多 ， 不 过 在 nm 较 大 时 ， 上 所 震 时 间 比 堆 排序 少 。 

实际 上 ， 在 基于 比较 的 排序 方法 中 ， 每 次 比较 两 个 关键 字 的 大 小 后 ， 仅 出 现 两 种 可 能 
的 转移 ， 因 此 可 用 一 棵 二 又 树 来 描述 比较 判定 的 过 程 ， 即 排序 问题 的 判定 树 。n 个 关键 字 
有 nl 种 排列 ， 每 种 排列 最 后 都 要 作为 一 个 叶子 《最 终结 果 ) 出 现在 判定 树 中 ， 即 判定 树 全 
少 有 nl 个 叶子 《有 些 叶 子 可 能 为 空 或 对 应 的 排列 相同 ， 取 决 于 具体 的 算法 )。 在 局 度 为 h 
的 二 又 树 中 , 叶子 结 点 数 不 超 过 2 一 , 反之 , 有 nl 个 叶子 的 二 又 树 高 度 至 少 为 | log, (n0) |+1。 
这 束 是 说 ， 最 多 比较 次 数 〈 即 最 坏 情况 下 的 比较 次 数 〉 全 少 为 [log,(n1)|=Omlog,n)， 这 
就 是 最 坏 情 况 下 的 最 好 时 间 复 杂 上 度 。 由 此 还 可 证 明 ， 当 n 个 关键 字 随 机 分 布 时 ， 平 均 比 较 
次 数 也 至少 为 O(log,(n!))= O(nlog,n)， 这 也 就 是 说 ， 时 间 复 杂 度 为 O(nlog,n) 的 排序 方法 
基本 上 是 基于 比较 的 排序 算法 中 效率 最 高 的 了 。 

(3) 大 n 很 大 ， 且 关键 字 有 明显 结构 特征 ， 如 和 字符 串 和 整数 ， 这 时 可 考虑 箱 排 友和 基 
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数 排序 。 由 于 箱 排序 和 基数 排序 上 只 需 一 步 就 会 引起 m 种 可 能 的 转移 ， 即 把 一 个 记录 装 入 mm 
个 箱子 之 一 ， 它 们 一 般 可 能 在 On) 时间 内 完成 排序 。 特 别 地 ， 当 记录 的 关键 了 学 位 数 较 少量 
可 以 分 解 时 ， 采 用 基数 排序 较 好 。 但 如 果 关 键 字 的 取 值 范围 属于 茶 个 无 穷 集合 (例如 实数 
型 关键 学 )， 就 无 法 使 用 箱 排序 和 基数 排序 ， 只 能 借助 于 “比较 ”的 方法 来 排序 。 

(4) 各 数据 表 的 初始 状态 已 按 关 键 字 基本 有 序 ， 则 可 选用 直接 插入 排序 或 冒 泡 排 序 ， 
这 时 的 时 间 复 杂 度 可 能 达到 O(n) 量 级 。 

(5) 在 对 稳定 性 有 要 求 ， 则 可 用 一 些 稳定 的 排序 方法 ， 如 直接 插入 排序 、 冒 泡 排 序 、 
归并 排序 和 基数 排序 等 。 但 是 ， 帮 是 对 主 关 键 字 排序 ， 则 排序 方法 是 否 稳 定 无 关 紧 要 。 

(6) 有 的 语言 (如 FORTRAN、BASIC 等 ) 没有 提供 指针 和 递归 ， 则 一 般 只 能 选择 不 
需要 这 些 技术 的 排序 算法 。 

(7) 前 面 讨论 的 排序 算法 ， 除 基数 排序 外 ， 都 是 在 一 维 数组 上 实现 的 。 当 记录 本 号 信 
县 量 较 大 时 ， 为 避免 耗费 大 量 时 间 移 动 记 录 ， 可 以 用 链表 作为 存储 结构 〈 采 用 静态 链表 可 
节省 指针 空间 )。 直 接 插 入 、 直 接 选 择 、 冒 泡 排序 、 归 并 排序 等 都 易于 在 链表 上 实现 ， 其 中 
( 链 ) 表 归 并 排序 由 于 比较 次 数 最 少 ， 更 有 优势 。 

但 快速 排序 和 堆 排 序 等 在 链表 上 难于 实现 ， 这 时 可 以 提取 关键 学 建立 索引 表 ， 然 后 对 
索引 表 进 行 排序 。 但 更 简单 的 方法 是 进行 “地 址 排序 ”引入 一 个 数组 t[n] 作 辅助 表 ， 存 放 
各 个 记录 的 指针 (下 标 )。 排 序 前 ， 令 tli]=i (1 三 i 三 n);， 当 算法 中 要 求 交 换 RH 和 RJ] 时 ， 
只 需 交 换 相应 指针 如 ] 和 二] 即 可 ( 即 由 交换 记录 转换 为 交换 地 址 )。 排 序 结束 后 ， 所 有 指针 
将 按 相应 记录 键 值 递增 的 顺序 排列 ， 即 向 量 tm] 指 示 了 记录 之 间 的 顺序 关系 : 

RIt[lll.keyRIt[2||.key……Rltin||.key 

如 果 要 求 最 终 记 录 在 物理 上 递增 排列 : 

R|ll.keyR|2|.key*…RInl|.key 
则 只 要 按 索 引 表 或 辅助 表 所 规定 的 次 序 重 排 各 记录 即 可 ， 午 排 的 时 间 复 杂 度 是 O(n)。 

最 后 ， 为 使 大 家 对 各 种 排序 方法 有 一 个 具体 的 认识 ， 以 及 比较 一 下 相同 复杂 上 度 算 法 间 
的 相对 性 能 ， 这 里 引用 文献 [4] 的 一 组 实验 数据 ， 见 表 7.1。 计 复 条 件 是 奔腾 区 处 理 右 和 
Windows 98 操作 系统 ， 待 排序 值 是 32 位 (bit) 的 随机 整数 ， 分 别 对 不 同 规模 的 序列 对 比 
计算 。 由 于 记录 不 大 , 移动 次 数 少 的 算法 如 选择 排序 没有 显示 出 其 优势 。 有 些 排序 有 两 组 ， 
其 中 希 尔 排 序 分 别 对 应 增 量 每 次 折 半 和 每 次 除 以 3; 快速 排序 的 第 一 组 是 一 般 的 递归 算法 ， 
第 二 组 是 非 递归 的 且 不 划分 长 度 小 于 10 的 子 序列 , 最 后 调用 插入 排序 ; 归并 排序 的 第 一 组 
是 一 般 的 递归 算法 , 第 二 组 采用 了 监视 哨 技 术 , 并 对 长 度 小 于 10 的 子 序 列 采 用 选择 排序 进 
行 处 理 ;， 基 数 排序 不 按 十 进 制 处 理 ， 而 是 每 次 处 理 4 个 或 8 个 二 进 制 位 (前 者 相当 于 按 
十 六 进 制 处 理 )， 但 取出 有 关 位 时 没有 采用 移 位 运算 。 

从 表 7.1 可 见 ， 时 间 复 杂 度 为 O(n ) 的 算法 确实 不 适合 表 长 较 大 的 情况 ， 其 中 插入 排序 
的 效果 略 好 一 点 ; 当 规模 较 大 时 ， 希 尔 排 序 明 显 优 于 O(n ) 类 算法 ; 快速 排序 ， 特 别 是 改进 
后 的 快速 排序 是 所 有 算法 中 最 出 色 的 ; 同类 算法 的 改进 并 不 能 有 数量 级 上 的 变化 ， 但 相对 
速度 可 能 有 50% 的 提高 。 基 数 排序 的 效果 并 不 突出 ， 但 较 大 的 基数 可 减少 分 配 的 趋 数 ， 对 
总 的 时 间 可 能 是 有 益 的 。 
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表 7.1 排序 算法 实验 比较 


10K 
| | 上 款 秆 本 
插入 排序 | 0011 | 033 | 286 | 3521 | 47241 | - | 00 | 8030 
书 泡 排序 ”| .0011 | .093 | 918 | 10661 | 123808 | — | 5135 | 8123 
选择 排序 | 0011 | 072 | 582 | 5635 | 69437 | 一 | 5778 | 5608 
希 尔 排序 ”| 0o011 | 033 | 550 | 99 | 10 | 30%80 | 28 | 61 


RO | ol | 0 | 550 | 94 | 10 | as0 | 16— 

下 玉 | 0017 | oz2 | 03 | 3 | 4 | co | 17 | 22 
忆 二 内 70 | 0005 | olo| 07 | 33 | 4 | 0 | 1 11 
| 07 | 09 | oo | s | 1 |1M0| 60 

月 并 排序 7 38 
| 0016 | 028 | 038 | 60 | 9 | lc0| 50 | 5 
基 玫 排 让 74 2 2 


& .8 外 部 排序 简介 


以 上 各 节 讨论 的 排序 统称 为 内 部 排序 ， 整 个 排序 过 程 中 不 涉及 数据 的 内 、 外 存 交换 ， 
待 排序 的 记录 全 部 存放 在 内 存 中 。 但 在 许多 实际 问题 中 ,数据 表 的 记录 很 多 、 信 息 量 庞大 ， 
无 法 将 整个 数据 表 的 所 有 记录 同时 调 入 内 存 进行 排序 ， 只 能 将 数据 表 存放 在 外 存 上 ， 我 们 
称 这 种 排序 为 外 部 排序 。 外 存 上 的 数据 组 织 一 般 称 为 文件 ， 外 存 文件 主要 有 磁盘 文件 和 大 
带 文件 两 大 类 ， 它 们 排序 的 基本 步骤 类 似 ， 主 要 不 同 之 处 在 于 初始 归并 自在 外 存储 介质 中 
的 分 布 方式 ， 磁 盘 是 直接 存 取 设 备 ， 磁 带 是 顺序 存 取 设 备 。 

外 部 排序 的 实现 ， 除 了 依靠 数据 的 内 外 存 交换 外 ， 基 本 方法 是 “内 部 归并 ”。 首 先 ， 
根据 内 存 的 大 小 ， 将 待 排序 的 记录 Ri、R2、…、R 分 成 若干 段 。 依 次 读 入 每 段 的 记录 ， 利 
用 前 述 内 部 排序 方法 进行 内 部 排序 。 这 些 经 过 排序 的 有 序 段 通常 称 为 顺 串 《Run) 或 归并 
段 ， 再 将 其 写 入 外 存 。 这 样 ， 在 外 存 上 就 得 到 了 若干 个 初始 顺 串 。 最 后 ， 对 这 些 顺 串 进行 
归并 ， 使 顺 串 的 长 度 逐 渐 增 大 ， 直 至 全 体 待 排序 的 记录 成 为 一 个 顺 串 为 止 。 由 此 可 见 ， 外 
部 排序 由 两 个 相对 独立 的 阶段 组 成 : 生成 初始 顺 串 〈 初 始 归并 段 )》 以 及 对 顺 串 《归并 段 ) 
进行 归并 。 

归并 的 思想 并 不 复杂 ， 最 简单 的 归并 方法 是 类 似 于 前 述 Merge 算法 的 二 路 归并 。 假 设 
内 部 排序 产生 的 初始 顺 串 有 m 个 ， 进 行 两 两 归 并 后 就 得 到 [ny2 1 个 较 大 的 顺 串 ， 这 就 是 外 
排序 的 第 一 趟 归并 。n 个 记录 m 个 初始 顺 串 需 经 过 [log,m] 直 归并 才能 完成 外 部 排序 ， 每 
一 趟 需 进行 全 部 mn 个 记录 的 内 外 存 交换 。 

外 部 排序 的 时 间 由 三 部 分 组 成 ， 内 部 排序 的 时 间 ， 外 存 信息 读 写 的 时 间 ， 内 部 归并 的 
时 间 。 由 于 外 存 信息 读 写 的 时 间 比 记录 的 内 部 排序 和 归并 所 需 的 时 间 大 得 多 ， 因 此 提高 外 
部 排序 效率 的 关键 在 于 减少 数据 内 外 存 交换 的 次 数 ， 即 减少 归并 的 趟 数 。 显 然 ， 采 用 多 路 
归并 可 减少 归并 趟 数 : 对 上 路 归并 ， 归 并 趟 数 为 [log m] 。 另 外 ， 减 少 初始 顺 串 数 四 也 可 
减少 归并 趟 数 。 在 具体 实现 时 有 些 问题 需要 解决 ， 以 下 简单 做 些 介绍 。 
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7.8.1 磁盘 排序 


厂 盘 是 直接 存 取 设 备 ， 读 写 一 个 数据 块 的 时 间 与 当前 恋 写 头 所 处 的 位 置 关 系 不 大 。 

1. 败 者 树 

k 路 归并 时 ， 需 不 断 从 k 个 归并 段 的 当前 记录 中 选 出 最 小 者 ， 大 采用 直接 选择 排序 的 
思想 ， 则 每 次 都 需 k-1 次 比较 (已 归并 完 的 段 当前 记录 置 为 ce )。 对 全 部 nn 个 记录 要 选择 n 
次 ?, 于 是 一 趟 归并 完 要 比较 n(k-1) 次 , 则 | logum | 趟 归并 的 总 比较 次 数 为 | logum |n(k —1)， 
将 它 分 成 第 一 次 选择 和 以 后 n-1 次 选择 (以 便 ne 则 绪 


| logum |(k—1)+[logm | — DE-1)=|log,m | 一 一 一 TS 和 +| logm |@ 一 1) 一 一 一 ee 


由 于 (k 一 1])/[logyk| 随 k 增加 而 增加 ， 特 别 是 第 二 项 的 系数 [log ml - 1) 较 大 ， 所 以 
增加 归并 路 数 丰 会 导致 内 部 排序 时 间 增 大 ， 甚 至 抵消 减少 访 外 次 数 而 局 得 的 时 间 。 

实际 上 ， 每 次 的 k-1 次 比较 中 ， 很 多 在 前 一 次 找 最 小 时 就 已 经 比较 过 了 ， 由 于 没有 将 
结果 保留 下 来 ， 导 致 许 多 重复 比较 。 大 采用 树 形 选择 排序 的 思想 ， 则 每 趟 归并 时 ， 除 了 建 
树 〈 即 第 一 次 找 最 小 ) 为 k-1 次 比较 外 ， 以 后 每 次 选择 最 小 时 的 关键 字 比 较 次 数 最 多 为 
| log, k |， 则 | logm | 十 趟 归并 的 总 比较 次 数 最 多 为 : 


|log.m |(k—1)+|log.m |(n—1)| logyk |=| logym | 一 一 一 i i +| logm |(n—1) 


可 见 ， 虽 然 第 一 项 会 随 k 增 加 而 增加 ， 但 其 系数 不 大 ， 而 占 主导 地 位 的 第 二 项 却 与 路 
数 k 无 天 ， 从 而 增加 归并 路 数 k 减少 访 外 次 数 时 不 致 引 起 内 部 排序 时 间 的 显著 增 大 ， 有 利 
于 提高 外 排序 的 整体 效率 。 

但 需 指 出 ，Kk 值 并 非 越 大 越 好 。 因 为 系统 一 般 不 对 外 存 进行 直接 的 存 取 ， 而 是 通过 绥 
冲 区 进行 的 ( 见 下 一 章 ),， 在 一 定 的 缓冲 区 容量 下 ， 路 数 k 增加 则 每 路 的 缓冲 区 就 变 小 ， 于 
是 限制 了 内 外 存 交 换 的 数据 块 的 大 小 ， 相 应 地 每 趟 归并 时 就 要 更 多 次 地 读 写 数 据 块 ， 也 就 
增加 了 访 外 的 次 数 和 时 间 。 所 以 ，k 值 过 大 时 ， 尽 管 所 作 的 扫 摘 趟 数 减 少 ， 但 输入 /输出 时 
间 仍 可 能 增加 。k 的 最 优 值 与 可 用 绥 神 区 大 小 及 磁盘 的 特性 参数 等 有 关 。 

这 里 的 选择 树 一 般 采 用 败 者 树 (Tree ofLoser): 双亲 结 点 存放 败 者 〈 的 指针 )， 而 胜 者 
去 参加 高 一 层 的 比较 , 并 在 原 根 结 点 之 上 附加 一 个 结 点 存放 最 优 者 (的 指针 )。 知 双亲 存放 
的 是 胜 者 则 称 胜 者 树 ( 如 图 7.7)。 与 胜 者 树 相 比 ， 败 者 树 输出 最 优 者 后 ， 对 树 的 修改 容易 
些 : 新 记录 从 原 最 优 者 所 在 的 叶子 开始 ， 不 断 与 双亲 比较 ， 败 者 存放 到 双 杀 结 点 ， 胜 者 继 
续 与 上 一 级 双 杀 比较 ， 此 过 程 一 直 进 行 到 根 ， 最 后 将 新 的 最 优 者 存 到 附加 结 点 上 。 可 见 ， 
该 过 程 只 找 双 杀 结 点 而 不 必 找 兄弟 结 点 (也 就 不 必 区 分 左 兄弟 还 是 右 兄弟 了 )。 

图 7.14 (a) 所 示 为 从 5 个 归并 段 的 当前 记录 “22, 8, 19, 10, 21” 中 找 最 小 的 败 者 树 ， 
其 中 ce 表示 段 结束 《可 防止 归并 过 程 中 茶 个 归并 段 变 空 ， 即 保持 归并 段 数 不 变 ， 当 最 后 最 
优 者 为 c 时 结束 )。 图 7.14 (b) 所 示 为 输出 最 小 记录 后 ， 将 该 段 下 一 个 记录 26 蔡 换 抒 尺 
来 最 小 的 叶子 8， 然 后 从 该 叶子 到 根 ， 目 下 而 上 比较 和 调整 ， 选 出 次 小 关键 字 10。 


G 本 来 对 nm 个 数据 选择 排序 ， 只 需 选 择 mn-1 次 ， 但 这 里 的 数据 分 布 在 k 个 归并 段 上 ， 即 使 剩 最 后 一 
个 ， 也 并 不 知道 在 哪个 段 中 ， 仍 要 选择 一 次 ， 即 需 选 择 n 次 。 
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(a) 选 出 最 小 者 (b) 选 出 次 小 者 
图 7.14 利用 败 者 树 选 最 小 记录 


注意 ， 双 亲 存 放 的 并 不 是 两 个 孩子 中 的 败 者 〈( 较 大 者 )， 而 是 两 个 孩子 所 在 子 树 的 胜 
者 中 的 败 者 ( 较 大 者 )， 如 图 7.14(a) 中 阴影 结 点 10 存放 的 不 是 其 孩子 19 和 21 中 的 较 大 者 
21， 而 是 孩子 押 在 子 树 的 胜 者 8 和 10 中 的 败 者 10。 

败 者 树 初 始 化 时 ， 可 先 令 所 有 的 非 终 端 结 点 为 空 〈 指 针 )， 然 后 从 各 个 叶子 出 发 同上 
调整 非 终 疹 结 点 : 奋 双 杀 为 空 ， 则 存放 胜 者 ， 本 叶子 调整 结束 ; 否则 存放 败 者 ， 胜 者 继续 
向 上 调整 。 这 里 判断 双 杀 为 空 时 是 指针 比较 ， 判 断 胜 负 时 才 是 关键 字 比较 ， 共 kk-1 次 ”。 

2. 置换 -选择 排序 

为 了 减少 初始 归并 上段 数 m， 束 需要 使 每 段 的 长 度 尽 量 长 。 初 始 归 并 有 段 的 获得 ， 最 简单 
直接 的 方法 是 根据 内 存 和 物理 页 块 的 大 小 每 次 读 入 寿 干 记录 ， 内 排序 后 输出 得 到 一 个 初始 
归并 段 ， 这 个 过 程 进 行 下 去 ， 最 终 所 有 记录 便 被 划分 整理 成 了 夺 干 初始 归并 段 。 但 这 样 得 
到 的 各 初始 段 的 大 小 是 相同 的 (最 后 一 段 可 能 略 小 )， 且 受 内 存 和 物理 页 块 大 小 的 限制 , 长 
度 难 以 增加 。 

一 个 简单 的 改进 就 是 每 输出 一 个 最 小 记录 后 ， 马 上 再 输入 一 个 记录 ， 这 样 边 输 出 边 输 
入 ， 就 可 使 初始 归并 有 段 足够 长 。 但 是 有 个 问题 ， 就 是 硅 新 输入 的 记录 小 于 已 输出 的 记录 ， 
由 于 不 能 对 文件 中 的 记录 进行 插入 和 移动 ， 则 该 记录 应 划 入 下 一 个 归并 段 ， 这 可 将 其 标记 
为 新 的 归并 段 ， 竺 前 一 归并 段 的 记录 全 部 输出 后 ， 再 用 同样 的 方法 形成 新 的 归并 段 。 

其 中 ， 在 内 存 记 录 中 找 最 小 者 可 采用 前 述 败 者 树 ， 用 新 输入 的 记录 “置换 ” 刚 输出 的 
最 小 记录 后 骨 进 行 选择 。 为 了 正确 输出 前 后 两 段 的 记录 ， 将 结 点 比较 规则 改 为 ， 段 号 不 同 
时 段 号 小 者 胜 ， 段 号 相同 时 关键 学 小 者 胜 。 

以 上 过 程 称 作 置 换 - 选 择 排序 (Replacement-selection Sorting)， 它 的 特点 是 在 形成 初始 
归并 有 段 的 过 程 中 ， 选 择 ( 最 小 或 最 大 关键 字 ) 和 输入 、 输 出 交叉 或 平行 进行 。 显 然 ， 该 方 
法 得 到 的 初始 归并 段 长 度 一 般 不 同 ， 但 可 证 明 ， 当 输入 文件 的 关键 字 随 机 分 布 时 ， 初 始 归 
并 有 段 的 平均 长 度 是 内 存 工作 区 大 小 的 两 倍 。 
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GO 初始 化 时 ， 也 可 先 令 所 有 的 非 终 端 结 点 指 问 某 个 辅助 结 点 ， 其 中 数据 所 有 叶子 可 能 的 关键 字 ， 
然后 从 各 个 叶子 出 发 回 上 调整 。 这 时 要 涉及 和 辅助 结 点 的 内 容 比较 ， 关 键 字 比较 次 数 多 于 k--1 次 。 

@ 设 工作 区 有 w 个 关键 字 ， 人 至 少 它们 都 将 归并 到 同一 段 〈 即 归并 段 长 度 最 小 为 w)。 对 其 中 任 一 位 
置 ， 关 键 字 被 选中 输出 后 ， 新 输入 的 关键 字 比 它 小 或 大 的 概率 相同 ， 都 为 12; 才 是 后 者 则 它 以 后 仍 将 归 
并 到 当前 段 ， 即 新 关键 字 属 当前 段 的 概率 为 /2; 类 似 ， 该 关键 字 被 选中 输出 后 再 输入 的 关键 字 仍 属于 同 
一 段 的 概率 则 为 (1/2) 拓 1/4， 依 次 类 推 。 于 是 每 个 位 置 对 当前 段 贡 献 的 关键 字 个 数 为 1+1/2+1/4+…=2， 故 
段 长 平均 为 2w。 
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由 于 增加 了 段 号 比较 规则 ， 置 换 -选择 排序 的 败 者 树 初 始 化 时 ， 不 必 将 所 有 叶子 都 读 入 
后 册 建 立 ， 而 是 边 谈 入 边 建 立 : 令 初始 败 者 树 所 有 记录 的 段 号 为 0〈 实 际 没有 记录 )， 然 后 
逐个 读 入 叶子 ， 自 下 而 上 调整 败 者 树 ， 由 于 段 号 为 1， 相对 于 原 段 号 0 的 记录 目 然 为 败 者 ， 
从 而 逐个 填充 到 败 者 树 的 各 结 点 中 。 

图 7.15 表示 依次 输入 25, 19, 30, 35, 11, 08, 55, 10,… 时 ， 置 换 - 选 择 排序 中 败 者 树 的 部 
分 变化 过 程 ， 其 中 用 阴影 框 和 空白 框 区 分 不 同 段 的 结 点 。 

顺便 指出 ， 置 换 - 选 择 排序 也 可 用 堆 实 现 : 将 堆 顶 输出 ， 在 堆 顶 填 入 新 记录 ， 将 结果 调 
整 为 堆 ， 但 硅 新 记录 小 于 原 堆 项 ， 则 与 堆 抵 交换 后 再 调整 (新 堆 抵 为 下 一 组 ， 不 参与 本 轮 
调整 )。 然 后 再 输出 、 输 入 、 调 整 。 当 然 ， 前 述 k 路 归并 也 可 用 堆 实 现 。 


(g) 输入 08， 选 出 次 小 19 (h) 输入 55， 选 出 第 3 小 25 (i) 输入 10， 选 出 第 4 小 30 
图 7.15 置换 -选择 排序 的 败 者 树 


3. 最 佳 归并 树 

由 置换 -选择 排序 得 到 的 初始 归并 有 段 长 度 一 般 不 同 , 在 k 路 归并 时 , 不同 归 并 段 的 组 合 
将 导致 不 同 的 访 外 次 数 。 归 并 过 程 可 用 k 又 树 来 描述 : 每 k 个 段 归 并 后 得 到 一 个 新 的 段 ， 
将 新 段 作 双亲 ， 原 k 段 作 其 孩子 ， 最 后 成 为 1 段 ， 即 树 根 。 这 个 k 又 树 称 为 归并 问题 的 归 
并 树 (判定 树 )。 图 7.16 表示 的 是 对 长 度 分 别 为 0, 0, 12, 9, 5, 14, 17, 13, 10, 11, 15, 8, 16 的 
初始 归并 段 进 行 4 路 归并 的 两 种 方案 。 其 中 长 度 为 0 的 是 空 归并 段 。 
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(a) 4 路 归并 树 (b) 最 佳 4 路 归并 树 
图 7.16 4 路 归并 树 示例 


在 归并 树 中 ， 叶 子 为 初始 归并 段 ， 结 点 的 权 为 段 长 〈 记 录 数 )， 叶 子 到 根 的 路 径 长 度 
表示 归并 趟 数 ， 非 叶子 结 点 代表 归并 出 来 的 新 归并 段 ， 则 归并 树 的 珊 权 路 径 长 度 WPL 即 
为 归并 过 程 中 的 总 谈 记 录 数 ， 于 是 归并 过 程 中 总 的 记录 读 写 次 数 为 2xWPL。 图 7.16(a) 的 
WPL 为 : 


WPL=(0+12+5+17+9+13+0+14)x3+(10+15)x2+(11+8+16)x1=295 

不 同 的 归并 方案 所 对 应 的 归并 树 的 带 权 路 径 长 度 各 不 相同 。 为 了 使 得 总 的 读 写 次 数 达 
到 最 少 ， 需 要 改变 归并 方案 ， 午 新 组 织 归 并 树 。 为 此 ， 可 将 哈 夫 曼 树 的 思想 扩 序 到 广 树 
上 : 在 归并 时 ， 让 记录 数 少 的 归并 有 段 先 归并 ， 记 录 数 多 的 归并 有 段 后 归并 ， 就 可 以 建立 总 的 
谈 写 次 数 最 少 的 最 佳 归并 树 。 图 7.16(b) 束 是 一 棵 最 佳 归 并 树 ， 它 的 WPL 为 : 

WPL=(0+0+5+8)x3+(13+14+15+9+10+11+12)x2+(17+16)x1=240 

为 了 分 析 和 处 理 方便 ， 一 般 使 归并 树 为 严格 三 又 树 (或 称 正则 三 叉 树 ， 除 叶子 外 ， 其 
他 结 点 的 度 都 为 3), 这 可 能 需要 补充 耕 干 空 归并 段 ,。 设 0 度 结 点 有 no 个 ,上 度 结 点 有 n, 个 ， 
易 知 n=(k 一 Dn +1， 于 是 mn, = 人 一 ])/(k 一 1) 。 如 末 该 式 能 整除 ， 则 不 需 补 充 空 归并 段 ; 
售 则 设 On, -Do%(k-D=mz0， 则 将 n, 增 加 人-1-m 即 可 整除 ， 即 补充 (区 -1)-m 个 空 归并 
段 即 可 。 在 图 7.16 所 示例 子 中 , 非 空 段 n=11;,k=4,m=(11 下 )%(4-1)=1, 故 需 补充 (kK-1)-m=2 
个 空 归并 上 段 。 

以 上 记录 的 读 写 是 指 逻辑 记录 ， 大 每 个 物理 块 存放 1 个 记录 ， 则 逻辑 读 写 和 物理 读 写 
是 一 致 的 。 奋 每 个 物理 块 存 放 多 个 记录 ， 则 可 按 各 段 所 占 的 物理 块 数 进行 类 似 的 分 析 。 


7.8.2 ”磁带 排序 


人 磁 市 排序 的 过 程 也 是 先生 成 初始 归并 段 ， 再 反复 归并 下 到 全 部 归并 成 一 段 。 但 磁 市 古 
顺序 存 取 设 备 ， 不 能 在 同一 磁 市 上 进行 多 路 归并 盏 则 寻找 各 归并 段 的 读 写 位 置 会 引起 大 
量 的 进 融 、 倒 带 ， 效 率 极 低 )， 即 磁 融 归并 及 排序 需要 多 人 台 磁 市 机 。 另 外 ， 各 归并 段 在 不 同 
磁 市 以 及 同一 磁 市 的 不 同 分 布 情况 对 排序 效率 影响 极 大 。 

磁带 的 k 路 归并 排序 全 少 要 k+l 台 磁 带 机 : 

(1) 形成 初始 归并 段 时 ，1 台 作 输入 ，k 人 台 作 输出 。 根 据 内 存 和 页 块 的 大 小 每 次 读 入 
耕 干 记录 ， 内 排序 后 将 结果 轮流 与 到 其 他 kk 条 市 上 。 显 然 ， 也 可 用 置换 -选择 排序 生成 长 度 
不 等 的 初始 归并 段 ， 但 在 磁 市 上 不 能 进行 最 佳 归并 排序 。 

(2) 进行 k 路 归并 时 ，k 台 作 输入 ，1 台 作 输出 。 这 时 ， 归 并 结果 在 一 条 市 上 ， 归 并 
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完 后 要 对 输出 读 扫 摘 一 过 ， 将 其 中 的 各 归并 段 重新 分 配 到 k 条 市 上 上， 以便 下 次 归并 。 

为 了 避免 输出 市 的 这 种 分 配 扫 摘 ， 可 采用 2k 人 台 磁 市 机 ,其 中 下 人 台 作 输入 , k 人 台 作 输出 ; 
一 趟 归并 完 后 ， 输 入 这 和 输出 市 的 作用 互 换 (同时 输入 市 和 输出 市 要 反 转 到 开始 位 置 )， 即 
各 伺 市 机 轮流 地 作 输 入 和 输出 。 

注意 到 这 样 一 个 事实 : 如 果 各 磁 市 上 的 归并 段 数 不 同 〈 称 为 非 平 衡 归 并 ， 反 之 ， 帮 各 
磁 珊 上 的 归并 段 数 基 本 相同 ， 则 称 为 平衡 归并 )， 则 在 归并 过 程 中 ， 归 并 段 数 最 少 的 市 在 茶 
一 时 刻 就 变 成 了 空 市 ， 于 是 该 市 可 用 作 输 出 珊 《〈 退 到 开始 位 置 )， 而 原 输出 这 已 生成 的 归并 
段 〈 退 到 开始 位 置 ) 连同 原 剩 余 归 并 有 段 一 起 可 用 作 输 入 ， 重 新 开始 归并 。 这 样 ， 某 赵 归 并 
中 不 等 全 部 记录 归并 完 ， 就 在 已 有 基础 上 开始 了 新 的 一 赵 归 并 。 这 个 过 程 称 作 多 步 归 并 
(Polyphase Merging Sorting)。 这 时 ，k 路 归并 可 只 用 k+l 人 台 磁 市 机 ， 其 中 每 台 轮 流 成 为 输 
出 市 ， 输 入 、 输 出 的 转折 点 是 芭 条 输入 市 变 空 。 

显然 ， 为 了 使 多 步 归 并 的 趟 数 最 小 ， 必 须 合 理 分 配 各 磁带 上 的 初始 归并 段 数 。 注 意 到 
最 后 一 步 时 ， 一 条 市 为 空 ， 其 他 各 市 都 仅 剩 一 段 ， 据 此 往 回 推算 ， 可 发 现 各 磁 珊 上 的 归并 
段 数 与 K 阶 Fibonacci 数列 有 天。 假设 初始 归并 段 总 数 满足 (否则 补充 夯 干 长 度 为 0 的 空 段 ): 

T=kfit(k—1)fiit***+2fi 2 和-D 
则 各 市 的 初始 归并 段 数 应 为 : 

Pe i i 

EPE 


es 
TE 
k 阶 Fibonacci 数列 定义 如 下 : 
0 1 | 网， Kk 一 2 
1 n=k—l 
i n>k 
以 k=3 为 例 ， 该 数列 为 0, 0, 1, 1, 2, 4, 7, 13, 24, 44, 81,…。 若 初始 归并 段 有 193 个 ， 


并 采用 3 路 归并 ， 则 由 于 3fs+2fs+b=193， 于 是 各 带 的 初始 归并 段 数 为 T=fo+fst+fy=81， 
工 一 fo+fs=0 8 》 1 3=fo=44 0 


7.1 对 于 给 定 的 一 组 关键 字 : 

503，087，512，061，908，170，897，275，653，462 

分 别 写 出 直接 插入 排序 、 希 尔 排 序 〈 增 量 为 S, 2,1)、 冒 泡 排序 、 直 接 选 择 排序 、 堆 排 
序 、 归 并 排序 和 基数 排序 的 各 趟 运行 结果 。 

7.2 ”相对 于 树 形 选择 排序 ， 直 接 选 择 排 序 和 扒 排 序 有 何 优 缺点 ? 

7.3 ”本章 介绍 的 排序 方法 中 哪些 是 稳定 的 ?哪些 是 不 稳定 的 ? 简单 分 析 一 下 不 稳定 
的 原因 。 
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7.4 试 比 较 直 接 插入 排序 、 直 接 选 择 排序 、 快 速 排序 、 摊 排序 、 归 并 排序 的 时 空 性 能 。 


7.5 分别 给 出 叶 结 点 数 n 为 4、5、6、7 的 树 形 选择 排序 示意 网 。 
7.6 ”在 1000 个 数据 中 找 两 个 最 小 的 ， 采 用 什么 方法 可 使 关键 字 比 较 次 数 最 少 ? 最 少 
为 多 少 ? 


7.7 已 知 A[1..1000] 中 存放 的 是 小 根 堆 , 现 要 找 其 中 最 大 的 , 至 少 要 几 次 关键 字 比 较 ? 
7.8” 知 不 要 求 完 全 排序 ， 仅 需 知 道 某 序 列 中 前 s 个 最 大 或 最 小 者 ， 试 给 出 解决 方法 。 
7.9 ” 试 给 出 n=7 的 关键 字 组 : 
(1) 使 快速 排序 的 第 一 直 , 每 个 关键 字 都 移动 一 次 。 该 直 移 动 次 数 是 多 少 ? n=8 呢 ? 
(2) 使 快速 排序 总 的 移动 次 数 最 少 ， 最 少 是 多 少 ? 
(3) 使 快速 排序 总 的 比较 次 数 最 少 ， 最 少 是 多 少 ? 
(4) 使 快速 排序 总 的 比较 次 数 最 多 ， 最 多 是 多 少 ? 
($5) n=7 时 ， 任 何 基 于 比较 的 排序 ， 最 坏 情 况 下 至 少 比较 多 少 次 ? 
7.10” 试 证 明快 速 排序 的 平均 时 间 复 杂 上 度 为 O(nlog,n)。 
7.11 试 写 一 个 通过 二 分 查找 来 寻找 插入 位 置 的 插入 排序 算法 ( 即 二 分 插入 排序 )。 
7.12 试 写 出 采用 监视 哨 技 术 的 希 尔 排 序 的 每 趟 插入 排序 算法 。 
7.13 ”设计 一 个 双向 冒 泡 排序 算法 ， 即 在 排序 过 程 中 交替 改变 扫描 方向 。 
7.14 设计 用 单 链 表 表 示 的 算法 : 
(1) 直接 插入 排序 。 
(2) 直接 选择 排序 。 
(3) 冒 泡 排序 。 
7.15 ” 试 写 出 算法 实现 以 下 功能 : 将 数组 A[1..n] 中 的 元 素 分 成 3 部 分 : 前面 为 负数 ， 
中 间 为 0， 后 面 为 正 数 ， 要 求 较 好 的 时 间 性 能 。 
7.16 试 写 出 快速 排序 的 男 两 种 划分 算法 。 
7.17 试 写 出 快速 排序 的 非 递 归 算 法 。 
7.18 ” 试 写 出 自 项 癌 下 (分 治 法 ) 的 二 路 归并 排序 算法 ， 并 分 析 其 时 间 复 杂 度 。 
7.19 己 知 关键 字 序 列 {ki, kz, ks，…, ko 是 大 根 堆 : 
(1) 试 写 一 算法 ， 将 {ki1， 0 Ka} 调整 为 大 根 堆 (提示 : 从 新 增 点 i 
调整 到 根 )。 
(2) 利用 (1) 的 算法 写 一 个 建立 大 根 堆 的 算法 。 
(3) 该 算法 建 堆 时 ， 最 多 比较 次 数 是 多 少 ? 
7.20 ”为 了 记录 数据 的 比较 过 程 和 结果 ， 是 否 就 一 定 要 用 完全 二 又 树 ? 
7.21” 设 磁盘 文件 中 记录 的 关键 字 分 别 为 16, 20, 43, 25, 18, 10, 13, 17, 9, 5。 假 设 工作 
区 可 容纳 4 个 记录 ， 试 用 选择 树 法 产生 初始 归并 有 段 。 
7.22 ”对 7 个 长 度 为 工 的 归并 段 进行 2 路 磁带 平衡 归并 排序 ， 试 写 出 归并 过 程 。 
7.23” 己 知 两 条 磁带 上 的 初始 归并 段 数 分 别 为 15 和 “ 35， 如果 用 2 路 多 步 归 并 结果 
如 何 ? 


查找 表 


但 找 又 称 检索 ， 也 是 数据 处 理 中 经 各 使 用 的 一 种 重要 的 运算 ， 几 乎 在 任何 一 个 计算 机 
系统 软件 和 应 用 软件 中 都 会 涉及 。 一 般 而 言 ， 各 种 数据 结构 都 会 涉及 得 找 操作 ， 如 前 面 介 
绍 的 线性 表 、 特 丈 线性 表 〈 栈 、 队 列 、 串 )、 数 组 、 广 义 表 、 树 与 图 等 均 可 能 需要 进行 查找 
操作 ， 但 没有 作为 主要 操作 考 碟 ， 它 服从 于 相应 的 数据 结构 。 在 有 些 应 用 中 ， 碍 找 操作 上 
升 到 主要 地 位 ， 如 使 用 的 频率 很 高 ， 且 所 涉及 的 数据 量 较 大 ,和 奏 找 的 效率 就 显得 格外 重要 ， 
尤其 在 一 些 实时 应 答 系 统 中 更 是 如 此 。 所 以 ， 为 了 提高 查找 效率 ， 要 专门 设置 面 问 查找/ 
检索 的 数据 结构 ， 即 奋 找 表 。 

本 章 首 先 介绍 得 找 的 一 些 基本 概念 , 然后 分 别 对 静态 得 找 表 、 树 表 和 散 列 表 进 行 介绍 。 
树 表 中 重点 介绍 二 又 排 序 树 ， 其 他 还 有 平衡 二 又 排序 树 、B 树 、B 树 和 空间 树 表 等 。 


.1 基本 概念 


但 找 的 概念 我 们 并 不 阳 生 ， 在 日 贡生 活 中 我 们 就 经 音 进 行 各 种 各 样 的 租 找 ， 如 奏 字 
( 词 ) 典 以 找 茶 个 字 〈 词 ) 的 含义 、 答 电话 号 人 码 本 以 找 茶 个 人 或 菜单 位 的 电话 、 在 地 图 中 找 
茶 个 城市 等 。 一 般 而 言 ， 答 找 是 在 大 量 信息 或 数据 中 获得 所 需要 的 信息 或 数据 。 在 数据 结 
构 中 ， 奏 找 指 的 是 在 大 干 数 据 元 素 〈 记 录 ) 的 集合 中 求 出 满足 某 给 定 条 件 的 记录 。 这 里 的 
“条 件 ” 可 能 是 多 种 多 样 的 ， 本 章 中 将 此 条 件 仅 限于 与 给 定 值 相 匹配 ， 于 是 有 如 下 定义 : 

查找 (Search) 束 是 在 n 个 数据 元 素 中 找 出 关键 学 等 于 给 定 值 K 的 结 点 。 硅 找到 ， 则 
称 和 但 找 成 功 ， 人 否则 称 得 找 失 败 。 一 般 情况 下 ， 得 找 成 功 时 ， 返 回 所 找到 的 记录 的 位 置 〈 指 
针 ) 或 给 出 该 记录 的 有 关 信 息 ; 不 成 功 时 返回 一 个 空 指 针 或 给 出 不 成 功 信息 。 

这 种 得 找 也 称 为 精确 和 查找。 其 他 的 得 找 还 有 范围 查找 〈 和 碍 找 关 键 字 在 茶 个 范围 内 的 记 
录 )、 组 合 人 查找 (查找 满足 多 个 条 件 的 记录 )、 模 糊 查 找 等 。 

和 排序 类 似 ， 查 找 也 有 内 查找 和 外 查找 之 分 。 前 者 指 涉及 的 查找 对 象 全 部 在 内 存 ;， 后 
者 涉及 的 查找 对 象 很 多 ， 不 能 一 次 性 全 部 存 入 内 存 ， 在 查找 过 程 中 ， 需 要 访问 外 存 。 

与 排序 类 似 ， 评 价 奏 找 算法 的 好 坏 ， 一 般 也 是 考察 算法 的 时 间 和 附加 空间 耗费 ， 以 及 
算法 的 复杂 程度 等 。 由 于 附加 空间 一 般 都 不 大 ， 故 主要 考察 查找 的 时 间 开 销 。 

由 于 查找 运算 的 主要 操作 是 关键 字 的 比较 ， 所 以 ， 通 常 把 查找 过 程 中 对 关键 字 需 要 执 
行 的 平均 比较 次 数 〈 也 称 为 平均 但 找 长 度 ) 作为 衡量 一 个 得 找 算 法 效率 优 劣 的 标准 ， 平 均 
查找 长 度 (Average Search Length，ASL ) 定义 为 : 
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ASL= 》Ppici 
i=1 
其 中 ,，n 是 结 点 的 个 数 ; pi 是 查找 第 i 个 结 点 的 概率 ， 硅 不 特别 声明 ， 均 认为 每 个 结 点 的 


但 找 概率 相等 ， 即 p; =p; =…=ps =1/n ; ci 是 找到 第 1 个 结 点 时 所 需要 的 比较 次 数 。 

进一步 ， 设 查找 成 功 的 概率 为 p， 碍 找 不 成 功 的 概率 为 g=1-p， 还 可 定义 总 的 平均 查 
找 长 度 : 

ASL =p:ASL +q:ASL 

查找 表 (Search Table) 是 一 种 以 集合 为 逻辑 结构 、 以 查找 为 核心 运算 ， 同时 包括 其 他 
运算 的 数据 结构 。 由 于 集合 中 的 数据 元 素 之 间 是 没有 “关系 ”的 ， 因 此 在 查找 表 的 实现 时 
可 不 受 “ 关 系 ” 的 约束 ， 而 根据 问题 的 具体 情况 和 要 求 去 组 织 查 找 表 ， 以 便 实现 局 效 率 的 
查找 。 

查找 表 上 的 运算 一 般 有 建 表 、 查 找 、 读 表 元 、 插 入 和 删除 等 。 但 有 些 查找 表 在 建立 后 
基本 上 不 需要 进行 插入 和 删除 运算 ， 于 是 我 们 在 实现 和 应 用 时 可 有 针对 性 地 进行 处 理 以 提 
高 效率 。 为 此 将 查找 表 分 成 两 类 : 静态 查找 表 和 动态 查找 表 。 

静态 查找 表 刻 男 并 适应 于 下 列 场合 : 但 找 表 一 经 生成 之 后 ， 便 只 对 其 进行 检索 〈 包 括 
查找 和 读 表 元 ) 而 不 进行 修改 (插入 和 删除 ); 或 者 进行 一 段 时 间 的 检索 之 后 集中 地 进行 修 
改 。 也 就 是 说 ， 作 为 主要 工作 的 检索 与 作为 次 要 工作 的 修改 被 分 为 两 个 不 交叉 的 阶段 分 别 
进行 ， 每 个 阶段 只 做 一 项 工作 。 相 反 ， 动 态 查 找 表 刻画 并 适应 于 下 列 场合 : 检索 与 修改 交 
又 进 行 ， 无 法 分 成 两 个 不 相交 的 阶段 。 

静态 查找 表 包 括 以 下 3 种 基本 运算 : 

(1) 建 表 CREAT(ST)。 加 工 型 运算 ， 生 成 一 个 由 用 户 给 定 的 阁 干 数据 元 素 组 成 的 静态 
查找 表 ST。 

(2) 查找 SEARCH(ST K)。3 引 用 型 运算 ， 在 查找 表 ST 中 查找 键 值 等 于 K 的 数据 元 素 
的 位 置 ， 奎 没有 ， 结 果 为 一 特殊 标志 。 

(3) 读 表 元 GET(ST, D)。 引 用 型 运算 ， 取 三 找 表 ST 中 1 位 置 上 的 数据 元 素 的 值 。 

动态 查找 表 包 含 以 下 5 种 基本 运算 : 

(1) 查找 。 同 静态 查找 表 。 

(2) 读 表 元 。 同 静态 查找 表 。 

(3) 插入 INSERT(ST K)。 加 工 型 运算 ， 在 查找 表 ST 中 插入 键 值 等 于 K 的 数据 元 素 ， 
若 原 来 已 有 键 值 等 于 K 的 数据 元 素 ， 则 不 插入 。 

(4) 删除 DELETE(ST, K)。 加 工 型 运算 ， 在 查找 表 ST 中 删除 键 值 等 于 K 的 数据 元 素 。 

(5) 初始 化 INITIATE(ST)。 加 工 型 运算 ， 设 置 一 个 空 的 动态 查找 表 。 

注意 ， 动 态 碍 找 表 的 基本 运算 中 没有 建 表 ， 因 为 它 的 表 结 构 是 在 查找 过 程 中 动态 生成 
的 ， 即 当 碍 找 不 成 功 时 就 插入 相应 的 结 点 。 另 外 ， 插 入 、 删 除 运算 也 会 修改 表 结 构 ， 所 以 
也 可 按 表 结构 在 查找 过 程 中 是 否 会 变化 来 定义 《或 区 分 ) 静态 查找 表 、 动 态 查 找 表 。 

在 存储 实现 上 ，4 种 基本 的 存储 结构 查找 表 都 可 采用 ， 如 前 态 查 找 表 主要 采用 顺序 存 
储 和 索引 存储 ; 树 表 主要 采用 链 式 存储 ;， 散 列表 采用 散 列 存储 。 因 为 查找 是 对 已 存 入 计算 
机 的 数据 所 进行 的 操作 ， 所 以 数据 的 具体 组 织 形式 ， 即 存储 结构 对 查找 速度 会 有 决定 性 的 
影响 。 


由 于 两 种 查找 表 的 实现 涉及 的 问题 差别 很 大 ， 下 面 各 节 将 分 别 讨论 。 
(8.2” 静 态 查找 表 实现 


静态 但 找 表 通 笛 是 将 数据 元 素 组 织 为 一 个 线性 表 ， 可 以 采用 顺序 存储 ， 也 可 以 采用 链 
了 存储 。 裔 态 碍 找 表 的 建 表 和 谈 表 元 运算 比较 向 单 ， 下 面 主 要 研究 查找 运算 在 不 同人 存储 表 
示 下 的 实现 。 本 节 主 要 介绍 3 种 得 找 方法 : 顺序 得 找 、 二 分 得 找 和 分 块 得 找 。 注 意 ， 它 们 
同样 也 可 用 于 一 般 线性 表 上 进行 查找。 


8.2.1 顺序 表 上 的 查找 


静态 但 找 表 最 简单 的 实现 方法 是 采用 顺序 存储 络 构 ， 并 在 此 基础 上 实现 其 基本 运算 
《这 里 只 考虑 得 找 的 实现 )， 我 们 把 这 种 实现 的 得 找 表 称 为 顺序 〈 碍 找 ) 表 ， 它 和 我 们 在 线 


性 表 中 介绍 的 顺序 表 是 有 区 别 的 : 后 者 的 结 点 之 间 有 逻辑 关系 ， 结 点 的 存储 位 置 在 次 序 上 
与 迎 辑 次 序 一 致 ， 而 这 里 结 点 之 间 没 有 多 辑 关 系 ， 结 点 的 存储 位 置 不 表示 逻辑 关系 ， 它 们 
可 以 是 任意 的 。 由 于 两 者 的 查找 方法 相同 ， 我 们 这 里 也 不 严格 区 分 。 顺 序 表 的 类 型 定义 
如 下 : 
const int maxsize=100; / /顺序 表 的 容量 ( 表 长 ) ， 假 设 为 100 
typedef struct { 
keytype key; / /关键 字 项 
othertype other; // 其 他 域 〈 根 据 实际 情况 设置 或 取消 ) 
} record; // 奋 找 表 的 结 点 类 型 


typedef struct { 
record data[maxsize+1]; // 从 data[1] 开 始 存放 数据 


int n; / /顺序 表 实 际 元 素 个 数 
} sqtable; / /顺序 表 的 类 型 
sqtable R; / /顺序 表 


这 里 ， 从 数组 data 的 1 号 单元 开始 存放 数据 , 0 号 单元 未 用 , 但 可 用 于 设置 “监视 哨 ”， 
见 下 面 的 叙述 。 

在 顺序 表 上 一 种 最 简单 直观 的 得 找 方法 是 顺序 查找 〈Sequential Search)。 它 的 基本 思 
想 是 : 从 表 的 一 端 开 始 , 顺序 扫描 得 找 表 , 依次 将 扫描 到 的 结 点 关键 字 和 给 定 值 玉 相 比 较 ， 
吉它 们 相等 ， 则 三 找 成 功 ， 并 给 出 数据 元 素 在 表 中 的 位 置 ; 奋 全 部 元 素 扫 描 完 后 ， 仍 未 找 
到 关键 学 等 于 K 的 结 点 ， 则 查找 失败 。 

具体 得 找 时 ， 可 从 前 癌 后 进行 ， 也 可 从 后 回 前 进行 ， 第 2 和 草 顺 序 表 的 定位 〈 按 值得 找 ) 
算法 采用 的 就 是 从 前 问 后 的 顺序 查找 。 这 里 再 考察 一 下 从 后 回 前 的 顺序 查找 ， 算 法 如 下 : 


int search (sqtable *R, keytype K) { 


了 机 长 了 

i1=R-—>n; 

while(1i>0 && R->datal[lil] .key!=K) 工 -一 ;7 

return i; // 碍 找 成 功 时 返回 K 在 表 中 的 序号 ， 否 则 返回 0 


SA 数据 结构 教程 与 题解 


其 中 while 循环 结束 时 有 两 种 可 能 :查找 成 功 或 失败 ， 本 应 分 不 同情 况 进行 返回 ， 即 
查找 成 功 时 返回 找到 的 位 置 1 (1>0)， 失 败 时 返回 0。 但 查找 失败 时 1 正好 也 为 0， 所 以 不 
论 查 找 成 功 与 否 ， 都 可 用 “returm i;” 表 示 。 

循环 中 要 检查 下 标 是 否 越 界 >0,， 如 果 将 及 ->data[0] 用 来 设置 监视 哨 ,， 则 可 使 省 去 这 一 
条 件 的 检查 ， 从 而 节省 比较 的 时 间 。 这 种 技巧 在 第 7 章 直 接 插入 排序 中 就 已 用 过 。 禹 监视 


哨 的 顺序 查找 算法 如 下 : 

int Search (sqtable *R, keytype K) 1 

了 区 二 证 

R->data[0] .key=K; / /设置 监视 哨 

1=R—>n; 

while (R->datal[lil].key!=K) 工 -一 ; 

return 1 / /查找 成 功 时 返回 在 表 中 的 序号 ， 耕 则 返回 0 
} 


显然 ， 耕 找到 的 记录 是 R->dataIn]， 则 比较 次 数 cs =1; 硅 找 到 的 是 R->data[1]， 则 比 
较 次 数 c =n ; 一 般 情况 下 ,找到 顺序 表 中 第 1 个 记录 时 所 需 的 比较 次 数 为 c; =n-1+1。 假 
定 每 个 记录 被 得 找 的 概率 相等 ， 则 pi=ln ， 从 而 

ASL= yp > or-i+D=2 =-oO 
i=l i=1 卫 

这 就 是 说 ， 奏 找 成 功 时 的 平均 比较 次 数 约 为 表 长 的 一 半 。 显 然 ， 对 于 不 成 功 的 得 找 ， 
比较 过 程 一 直 进 行 到 监视 哨 结束， 比较 次 数 为 n+1《〈 无 监视 哨 时 为 次， 但 再 下 标 检查 )。 

不 论 成 功 与 否 ， 总 的 平均 比较 次 数 为 

ASL=p'ASLsc+dq'ASLun=p'(n+1l)/2+(1-p)(n+l)=(n+l) (1-p/2) 

可 得 (n+1)/2<ASL<(n+1)， 即 不 论 枉 找 成 功 与 否 ， 平 均 比 较 次 数 最 少 (n+1)/2 次 ， 最 多 
nt+l] 次 。 

不 难 发现 ， 顺 序 碍 找 也 可 用 于 链 式 组 织 的 得 找 表 〈 对 单 链 表 从 前 癌 后 进行 ) ， 而 链表 
适合 于 插入 和 删除 运算 ， 所 以 顺序 查找 法 也 可 用 于 动态 人 查找 表 。 

在 很 多 情况 下 ， 但 找 表 中 数据 元 素 的 僵 找 概率 是 不 相等 的 。 以 从 前 问 后 进行 的 顺序 盘 
找 为 例 ， 不 等 概率 的 平均 得 找 长 度 为 : 


ASL = 》Pp; i = -2p 一 TD 
i=1 


显然 ，pl>pz>…>pa 时 ASL' 达到 最 小 值 。 这 需要 将 各 结 点 按 查 找 概率 由 大 到 小 的 次 
序 存放 。 但 各 结 点 的 查找 概率 事先 一 般 并 不 知道 ,为 了 提高 查找 效率 , 可 对 算法 做 些 修改 。 

方法 一 : 每 个 结 点 增加 一 个 查找 频率 计数 器 ， 每 查找 一 次 ， 计 算 器 增 1， 如 果 某 结 点 
的 查找 频率 超过 了 其 前 面 ( 指 查找 开始 方向 的 那 一 侧 ) 的 结 点 ， 就 交换 两 者 的 位 置 。 这 样 
查找 概率 大 的 结 点 在 查找 过 程 中 不 断 往 前 移 ， 可 减少 以 后 重复 查找 时 的 比较 次 数 ， 但 该 方 


法 增加 了 结 点 的 存储 空间 。 
方法 二 : 每 当 查 找 成 功 ,就 将 找到 的 结 点 向 前 移动 一 步 ， 即 和 它 前 面 的 结 点 (车 存在 ) 
交换 。 这 也 可 使 查找 概率 大 的 结 点 不 断 往 前 移 。 
方法 三 ， 如 果 查 找 表 是 用 链表 组 织 的 ， 还 可 以 将 每 次 找到 的 结 点 移 到 链表 的 头 部 顺 
序 组 织 时 这 种 移动 不 方便 ， 要 引起 大 量 结 点 的 后 移 )， 更 利于 以 后 重复 查找 , 这 有 点 类 似 组 


存 技术 。 


顺序 奏 找 的 优点 是 算法 简单 ， 且 对 表 的 结构 无 任何 要 求 ， 无 论 是 用 癌 量 还 是 用 链表 来 
存放 结 点 ， 也 无 论 结 点 之 间 是 否 按 关 键 字 有 序 ， 它 者 适用。 顺序 得 找 的 缺点 是 查找 效率 低 ， 
因此 ， 当 nm 较 大 时 ， 不 家 采用 顺序 碍 找 。 


8.2.2 ”有 序 表 上 的 碍 找 


一 般 情 况 下 ， 关 键 字 之 则 可 能 构成 某 种 次 序 关 系 ， 如 键 值 为 数值 型 时 ， 数 值 的 大 小 就 
是 一 种 次 序 关 系 ; 铬 键 值 为 学 符 型 ， 字 典 序 就 是 一 种 次 序 关 系 。 注 意 ， 这 里 的 次 序 关系 不 
是 逻辑 关 系 。 大 顺序 表 中 各 结 点 按键 值 的 某 种 次 序 排列 成 有 序 表 ， 则 得 找 时 可 采用 效率 较 
高 的 一 些 算法 ， 如 二 分 查找 等 。 在 以 下 讨论 中 ， 假 设 有 序 表 是 递增 有 序 的 。 

1. 二 分 查找 

二 分 查找 (Binary Search) 又 称 折 半 查找 ， 其 基本 思想 是 : 首先 将 竺 查 的 KK 值 和 有 了 序 
表 中 间 位 置 mid 上 的 结 点 的 关键 字 key 进行 比较 ， 大 相等 ， 则 碍 找 完 成 ; 否则 ， 知 K<key， 
则 说 明 每 查找 的 结 点 只 可 能 在 有 序 表 中 mid 位 置 左边 的 子 表 中 ， 则 在 左 子 表 中 继续 进行 二 
分 查找 ， 奎 K>key， 则 说 明 待 查找 的 结 点 只 可 能 在 mid 位 置 右 边 的 子 表 中 ， 则 在 右 子 表 中 
继续 进行 二 分 查找 。 如 此 进行 下 去 ， 直 到 找到 关键 字 为 K 的 结 点 ,或 者 当前 的 查找 区 间 为 
衬 〈 即 查找 失败 )。 这 样 ， 每 经 过 一 次 关键 字 比 较 ， 剩 下 的 查找 区 间 束 缩小 为 原来 的 一 半 ， 
二 分 或 折 半 查找 即 由 此 得 名 。 

例如 ， 假 设 被 查找 的 有 序 表 中 关键 学 序列 为 : 

S, 11, 23, 3S, Sl1l, 64, 712, 85, 88, 90, 98 

当 给 定 的 K 值 分 别 为 72 和 30 时 ， 进 行 二 分 碍 找 的 过 程 如 图 8.1 所 示 ， 其 中 方 括 写 表 
示 当 前 的 查找 区 间 。 

序号 1 2 | 4 6 7 8 9 10 11 


[5S 11 FA 64 72 ”85 88 90 98] 
low mid high 


5 11 -< 64 [72 85 88 90 98] 


low mid high 
5 11 233 33 人 1 64 [72 85] 88 90 98 


i EE 
(a) 查找 K=72 的 过 程 ( 三 次 关键 字 比 较 后 查找 成 功 ) 
序号 1 2 3 4 5 6 证 8 9 10 11 
[ss 1 23 本 5 64 f2 85 88 90 98] 


low mid high 
[5 11 23 35 51] 64 72 85 88 90 98 
+ + 
low mid high 
9， 23 135 51] 64 72 85 88 90 98 
tt t 
low mid high 
5 11 231 135 51 64 72 85 88 90 98 
t t 


high low 
(b) 查找 K=30 的 过 程 ( 三 次 关键 字 比 较 后 查找 失败 ) 


图 8.1 二 分 查找 过 程 示例 
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显然 ， 寿 表 中 有 多 个 关键 字 相 同 ， 则 找到 的 只 是 它们 中 的 某 一 个 ， 不 一 定 是 最 前 (或 
最 后 ) 的 一 个 (顺序 查找 则 是 )。 二 分 查找 算法 如 下 : 
int BiSearch (sqtable *R,keytype K) {// 升 序 折 半 查 找 ， 非 递归 算法 
int low,high,mid; //low、high 表示 当前 但 找 区 间 的 下 界 和 上 界 
low=l1;high=R-—>n; 
while (low<=high) { 
mid= (low+high) /2; // 求 中 间 位 置 
if (K==R->data [mid] .key) return mid;  // 找 到 
else if(K<R->data[mid] .key) high=mid-1;// 下 次 在 前 半 部 分 查找 
else low=mid+1; // 下 次 在 后 半 部 分 但 找 
} 
return 0; // 查 找 失 败 
} 
二 分 查找 过 程 也 可 以 递归 地 进行 ， 故 也 可 很 容易 地 写 出 相应 的 递归 算法 (上 略 )。 
在 二 分 查找 中 ， 每 次 都 以 表 的 中 点 为 比较 对 象 ， 将 表 分 为 两 个 子 表 ， 对 定位 到 的 子 表 
册 进 行 同样 的 操作 。 这 一 过 程 可 用 一 棵 二 叉 树 来 摘 述 : 将 当前 查找 区 间 中 间 位 置 上 的 结 点 
作为 根 ， 左 子 表 和 右 子 表 中 的 结 点 分 别 组 成 根 的 左 子 树 和 右 子 树 ， 而 左右 子 树 又 按 同 样 的 
规则 建立 ，……… 。 由 此 得 到 的 二 叉 树 ， 称 为 描述 二 分 租 找 的 判定 树 (Decision Tree)。 显 然 ， 
整个 判定 树 的 根 是 第 1 次 比较 的 中 点 结 点 ， 在 某 一 步 时 左 子 表 或 右 子 表 为 空 ， 则 对 应 的 子 
树 为 空 。 
例如 ， 上 述 11 个 结 点 的 有 序 表 的 二 分 得 找 过 程 可 用 图 8.2 所 示 的 判定 树 表 示 ， 树 中 结 
点 内 的 数字 表示 该 结 点 在 有 序 表 中 的 位 置 。 从 图 中 可 见 ， 夺 查找 的 结 点 正好 是 表 中 第 6 个 
结 点 ， 则 只 需 进行 一 次 比较 ; 大 答 找 的 结 点 是 表 中 第 3 或 第 9 个 结 点 ， 则 需 进 行 二 次 比较 ; 
若 找 第 1、4、7、10 个 结 点 则 各 需 比 较 三 次 ; 若 找 第 2、5、8、11 个 结 点 则 各 需 比 较 四 次 ”。 
由 此 可 见 ， 二 分 查找 过 程 愉 好 是 走 了 一 条 从 判定 树 的 根 到 被 查 结 点 (或 某 个 空子 树 ) 
的 一 条 路 径 ， 经 历 比 较 的 关键 字 个 数 恰 为 路 径 中 的 结 点 数 〈 也 即 路 径 最 后 一 个 结 点 在 树 中 
的 层 数 )。 例 如 ， 图 8.2 中 根 右 侧 的 虚线 表示 图 8.1 (a) 查找 K=72 的 过 程 ， 其 中 将 分别 
与 结 点 6、9 和 7 比较 ， 共 进行 了 三 次 比较 后 查找 成 功 ;， 根 左 侧 的 虚线 表示 图 8.1 (b) 得 
找 K=30 的 过 程 ， 其 中 将 天 分 别 与 结 点 6、3 和 4 比较 ， 共 进行 了 三 次 比较 后 查找 失败 。 


图 8.2 11 个 结 点 的 二 分 查找 判定 树 及 查找 过 程 
注意 , 空子 树 实际 上 对 应 的 是 一 个 范围 , 如 结 点 4 的 左 子 树 表 示 大 于 R[3] 而 小 于 R[4]。 


Q 这 里 的 “比较 ”应 指 对 “ 结 点 ”的 比较 或 探查 ， 因 为 纯粹 从 关键 字 比 较 上 看 ， 对 每 个 结 点 x， 查 
找 成 功 时 比较 了 1 次 ， 不 成 功 时 又 进行 小 于 (或 大 于 ) 比较 ， 即 比较 了 2 次 : 1f(K 一 x.key)*…else 
if(K<x.key)…else…， 参 见 前 述 二 分 查找 算法 。 当 然 ， 从 汇编 语言 的 角度 看 ， 则 只 需 1 次 关键 字 比 较 : cmp 
K, x.key; je …; jl…。 这 是 因为 比较 产生 的 标志 位 可 多 次 使 用 〈( 即 相同 数据 不 需 再 次 比较 ， 除 非 标 志 位 被 
更 改 )。 


易 见 mn 个 结 点 的 判定 树 中 有 n+l 个 空子 树 ， 分 别 对 应 n 个 结 点 关键 字 之 间 的 区 间 范 围 。 

倍 助 判定 树 ， 可 推出 在 等 概率 情况 下 ， 二 分 得 找 的 平均 得 找 长 度 。 由 于 度 小 于 2 的 结 
点 只 可 能 在 最 下 面 的 两 层 上 ， 所 以 na 个 结 点 的 判定 树 的 高 度 h 和 mn 个 结 点 的 完全 二 又 树 相 
同 ， 为 log;+l) | 或 | log2n 上 上 1。 前 h-1 层 为 满 二 叉 树 ， 共 2 -1 个 结 点 ， 故 第 h 层 有 
n-(2” 一 1]) 个 结 点 ， 而 第 i1 层 结 点 的 查找 长 度 为 1， 所 以 平均 查找 长 度 为 : 

Sy =[lx20+2x2+:…+(h-Dx2 ?+hx(n—2" +1)]/n 
atl _ 21 
卫 卫 


其 中 级 数 和 1.2 +2.24…+k:2 =(k-1D.2+1( 见 附录 卫 )。 注 意 2 一 -1<n 和 2 一 1， 
h h—l 
则 上 式 第 二 项 1<2 20 -D+1 ;12， 而 第 一 项 hvh ， 所 以 ， 二 分 查找 
了 卫 卫 
的 平均 查找 长 度 约 介 于 h-1 到 h-2 之 间 。 而 树 的 高 度 h 就 是 查找 时 的 最 大 比较 次 数 〈 不 
论 成 功 与 否 )， 这 表明 ， 二 分 查找 的 最 坏 性 能 和 平均 性 能 相当 接近 。 特 别 地 ， 对 满 二 
又 树 : 


PT Bs BE 
卫 


ljog,(n+l)-1#=logn+l) 一 1 
n 


对 一 般 情 况 ， 也 第 用 该 式 佑 计 平 均 碍 找 长 度 《〈 比 准确 值 略 小 )。 

顺便 指出 : 

(1) 判定 树 本 喘 并 没有 要 求 结 点 编写 从 1 开始， 如果 我 们 将 编号 从 0 开始， 则 只 要 结 
点 数 相同 ， 判 定 树 的 结构 是 完全 相同 的 ， 仅 仅 是 树 中 每 个 结 点 的 序号 减 1 而 已 。 

(2) 判定 树 是 一 个 非 党 重要 的 概念 ， 也 是 一 个 非常 重要 的 辅助 分 析 工 具 。 我 们 在 第 5 
草 引 入 了 分 类 过 程 的 判定 树 ; 在 第 7 章 引 入 了 排序 过 程 的 判定 树 ， 现 在 又 有 了 和 奉 找 过 程 的 
判定 树 ， 而 很 多 其 他 问题 也 会 有 相应 的 判定 树 。 它 们 有 一 个 共同 特点 : 结 点 表示 东 种 比较 
或 判断 ， 分 文 表示 各 种 可 能 。 

对 俘 找 问题 ， 硅 判定 树 中 每 个 结 点 只 存放 一 个 关键 子 〈 一 般 用 相应 元 素 的 编写 表示 )， 
对 该 关键 字 比 较 后 可 产生 两 种 或 三 种 情况 ， 即 相等 、 不 等 ， 或 相等 、 小 于 和 大 于 ， 若 使 结 
点 本 身 就 表示 相等 情况 ， 则 每 次 比较 后 最 多 产生 两 个 分 文 ， 从 而 判定 树 为 一 棵 二 又 树 。 这 
时 结 点 的 比较 次 数 就 是 关键 字 的 比较 次 数 。 香 找 方法 不 同 ， 判 定 树 也 不 同 ， 如 顺序 碍 找 的 
判定 树 是 单 校 树 ;二 分 得 找 的 判定 树 是 形态 很 均衡 的 二 又 树 。 

一 般 地 ， 设 判定 树 中 有 n 个 结 点 ， 则 其 高 度 最 小 为 | log,(n+1) | 或 log2n 上 1， 与 二 分 
得 找 的 判定 树 相 同 ， 这 也 融 是 最 坏 情 况 下 关键 字 的 最 少 比较 次 数 。 对 成 功 的 但 找 ， 平 均 碍 
找 长 度 就 是 所 有 结 点 的 路 径 长 度 和 的 平均 值 +1。 设 想 把 高 度 大 的 结 点 移动 到 高 度 小 的 空位 
置 ， 则 路 径 和 必定 减少 。 所 以 最 小 路 径 和 在 树 高 最 小 时 达到 ， 从 而 叉 与 二 分 得 找 的 相同 ， 
于 是 平均 得 找 长 度 最 少 为 O(log2n )。 这 些 束 是 基于 关键 字 比 较 来 进行 得 找 的 算法 所 能 达到 
的 最 好 结果 ， 而 二 分 会 找 束 达到 了 这 个 最 好 结果 。 

显然 ， 寿 判定 树 中 每 个 结 点 存放 多 个 关键 字 ， 则 判定 树 为 多 又 树 。 这 时 树 的 避 度 和 平 
均 碍 找 长 度 都 可 能 减少 到 O(logsn )。 但 这 是 对 “ 结 点 ”比较 而 言 的 ， 而 每 次 对 结 点 比较 时 
一 般 要 进行 多 次 关键 季 比 较 ( 最 多 比较 完结 点 中 的 所 有 关键 字 , 可 参见 后 面 将 介绍 的 了 B 树 )， 
事实 上 ， 关 键 字 的 比较 次 数 最 好 仍 为 O(log,n )。 
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2. 插值 查找 

折 半 查找 每 次 以 数据 集 的 中 点 作为 比较 的 对 象 ， 并 将 数据 集 分 割 成 前 后 两 部 分 。 如 果 
已 知 两 个 端点 的 情况 ， 则 我 们 还 可 以 根据 当前 等 查 关 键 字 的 大 小 ， 利 用 数学 上 的 两 点 插值 
公式 确定 一 个 比较 准确 的 分 割 点 ， 这 就 是 (线性 ) 插值 查找 法 (Interpolation Search ) 。 

实际 上 我 们 在 日 闸 生 活 中 就 在 不 知 不 觉 地 使 用 看 这 种 方法 ， 如 查 英 文 词典 时 ， 夺 找 一 
个 以 Ww 开头 的 单词 ,我们 会 在 词典 的 较 后 部 分 而 不 是 在 开头 或 中 间 部 分 查找 ， 这 是 因为 词 
典 是 按 首 字母 顺序 排列 的 ， 我 们 要 找 的 w 肯定 位 于 较 后 部 分 。 分 割 点 的 插值 计算 式 为 : 

K—K(low) 1 

K(high)— K(low) 

其 中 low、high、mid 分 别 为 当前 人 查找 区 间 的 两 个 尊 点 和 分 割 点 的 下 标 , K(low)、K(high)、 
K 分 别 为 相应 点 的 键 值 。 插 值 查 找 法 的 实现 方法 与 折 半 查找 很 类 似 : 

(1) 夺 K=K(mid)， 则 僵 找 成 功 。 

(2) 大 KK<K(mid)， 则 置 high=mid-1， 继 续 在 左 区 间 奏 找 。 

(3) 若 K>K(mid)， 则 置 low=mid+1， 继 续 在 右 区 间 查 找 。 

插值 得 找 是 平均 性 能 最 好 的 查找 方法 ， 但 只 适合 关键 字 分 布 比较 均匀 的 情况 ， 其 时 间 
性 能 仍然 是 O(log,n )。 

3. 斐 波 那 契 查找 

除了 采用 数据 集 的 中 点 和 线性 插值 点 对 数据 集 进 行 分 割 外 ， 还 可 采用 斐 波 那 契 
(Fibonaccl) 数列 来 分 割 数据 集 。( 二 阶 ) 斐 波 那 契 数列 定义 如 下 : 


mld = low 十 


0 n=0 
F = | 
F ,+F,, n>2 
即 该 数列 为 : 0, 1, 1, 2, 3, 5, 8, 13, 21，…。 
如 果 初 始 待 查 区 间 长 度 n 正好 是 某 个 斐 波 那 契 数 -1( 若 不 是 可 在 数据 集 上 增设 告 干 虚 
结 点 )， 即 n=F(k)-1， 则 选取 该 区 间 [1, n] 内 序号 为 Fk 一 1) 的 点 作为 分 割 点 ， 它 将 数据 集 分 


为 两 个 部 分 : 左 区 间 长 上 度 为 F(kK-1)-1, 右 区 间 长 度 为 n-F(k-1)=[F(k)-1]-F(k-1)=F(k-2)-1。 
于 是 ， 竺 得 值 与 分 割 点 比较 后 ， 不 论 下 一 步 是 继续 在 左 区 间 奏 找 还 是 在 右 区 间 得 找 ， 两 个 
区 间 的 长 度 仍 是 茶 个 斐 波 那 契 数 -1， 于 是 对 了 于 区 间 又 可 进行 同样 的 处 理 。 当 mn 较 大 时 ， 每 
次 分 割 出 来 的 两 个 区 间 长 度 之 比 约 为 0.618， 即 数学 上 的 黄金 分 割 法 。 

一 般 情 况 下 ， 设 当前 得 找 区 间 为 [low, high]， 区 间 长 度 为 F(D-1， 则 分 割 点 的 下 标 为 
mid=low+[FG-1I)-]I。 由 非 波 那 契 数列 的 特点 可 知 ， 对 下 一 步 来 说 ， 右 是 左 区 间 ， 分 割 点 位 
置 将 为 FG-2); 各 是 右 区 间 ， 分 割 点 位 置 则 为 FG-3)。 人 至 于 每 个 非 波 那 契 数 ， 除 了 初始 区 
间 的 两 个 外 ， 其 他 区 间 可 由 后 同 前 递 推 求 出 。 于 是 ， 裴 波 那 契 得 找 算法 可 摘 述 如 下 。 

(1) 由 区 间 长 度 n 定 出 及 和 玉 ,， 其 中 mn=H -1; 

low=1, high=n:; 


Q 插值 查找 利用 了 关键 字 的 分 布 规律 (假设 为 线性 )， 由 函数 值 估算 位 置 ， 相 当 于 后 文 将 介绍 的 散 
列 查 找 ， 效 率 应 比 只 通过 关键 字 比 较 的 算法 高 些 ， 约 为 O(log,logyn )。 但 在 大 O 表示 下 ，O(logn ) 也 是 
其 一 个 上 界 。 


(2) 硅 low>high， 查 找 失 败 ， 结 束 ; 人 否则: 
i 
(3) 硅 K=K(mid)， 俘 找 成 功 ， 结 束 。 
(4) 若 K<K(mid)， 则 
high=mid—1:; 
Fx_2=Fx— Pe; 
Fr=Fxr i; Fx-=Fr 2; 转 (2); 
(5) 若 K>K(mid)， 则 
low=mid+1:; 
Fr oF Fr as Pr sFr Fr 2; 
FF 2; Fx=Fxr 3; 转 (2); 
可 以 证 明 ， 斐 波 那 契 查找 判定 树 的 高 度 约 为 1.441log,n”， 比 二 分 查找 的 大 ， 故 最 坏 情 
况 下 性 能 比 二 分 碍 找 差 , 但 平均 性 能 仍 为 O(log2n )。 该 方法 的 一 个 优点 是 不 需 乘 除法 运算 。 
男 外 ， 在 查找 过 程 中 查找 位 置 移动 的 平均 距离 比 二 分 查找 小 (从 这 点 看 平均 性 能 比 二 分 查 
找 “ 好 ” 但 不 是 比较 次 数 较 少 )。 
上 面 介 绍 的 3 种 得 找 方 法 ， 效 率 都 较 局 ， 但 都 要 求 关 键 字 有 序 并 且 是 顺序 存储 〈 从 而 
主要 用 于 静态 查找 表 ， 因 为 顺序 结构 里 插入 和 删除 不 方便 )。 
易 见 ， 可 把 它们 统一 成 广义 的 二 分 查找 将 区 间 一 分 为 二 ， 分 割 点 分 别 为 区 间 中 点 、 
线性 插值 点 、 肆 波 那 契 区 间 点 等 。 


8.2.3 系 引 顺序 表 上 的 碍 找 


索引 顺序 表 是 按照 索引 存储 方式 构造 的 一 种 存储 结构 ， 它 由 两 部 分 组 成 : 一 个 顺序 表 
和 一 个 索引 表 。 其 中 顺序 表 中 的 元 素 按 块 有 序 ， 对 每 一 块 ， 在 索引 表 中 建立 一 个 索引 项 ， 
所 有 索引 项 顺序 存储 组 成 索引 表 。 每 个 索引 项 由 两 部 分 组 成 : 块 中 的 最 大 关键 和 学 及 块 的 起 
始 位 置 。 由 于 顺序 表 是 分 块 有 序 的 ， 所 以 索引 表 是 一 个 递增 有 序 表 。 

这 里 所 谓 “ 按 块 有 序 ” 或 “分 块 有 序 ” 是 指 : 顺序 表 中 的 数据 可 划分 为 在 干 子 表 〈 块 ); 
每 一 块 中 的 关键 字 不 一 定 有 序 , 但 前 一 块 中 的 最 大 关键 字 必 须 小 于 后 一 块 中 的 最 小 关键 字 。 
例如 ， 图 8.3 就 是 满足 上 述 要 求 的 存储 结构 ， 其 中 顺序 表 R 有 18 个 结 点 ， 被 分 成 3 块 ， 每 
块 中 有 6 个 结 点 ， 第 一 块 中 最 大 关键 字 15 小 于 第 二 块 中 最 小 关键 字 17， 第 二 块 中 最 大 关 
键 字 35 小 于 第 三 块 中 最 小 关键 字 37。 

在 索引 顺序 表 上 的 查找 方法 是 分 块 查找 (Blocking Search) 或 称 索 引 顺 序 查找 ， 它 是 
一 种 性 能 介 于 顺序 碍 找 和 二 分 得 找 之 间 的 得 找 方法 。 它 的 基本 思想 是 : 首先 ， 但 找 索引 表 ， 
因为 索引 表 是 有 序 表 ， 故 可 采用 二 分 得 找 或 顺序 但 找 ， 以 确定 符 得 的 结 点 在 哪 一 块 ; 然后 
在 己 确 定 的 那 一 块 中 进行 顺序 碍 找 。 

例如 ， 在 图 8.3 所 示 的 存储 结构 中 ， 奏 找 关 键 了 字 等 于 给 定 值 K=20 的 结 点 ， 因 为 索引 
表 小 ， 不 妨 用 顺序 俘 找 方法 合 找 索引 表 。 即 首先 将 K 依次 和 索引 表 中 各 关键 字 比 较 ， 下 到 


(D 该 判定 树 相 当 于 后 文 将 提 到 的 AVL 树 在 结 点 数 最 少时 的 情形 之 一 ， 故 高 度 与 后 者 相同 ， 推 导 略 。 


*/ 
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找到 第 1 个 关键 字 大 于 等 于 K 的 结 点 ， 由 于 K<35， 所 以 ， 关 键 字 为 20 的 结 点 ， 若 存在 的 
话 ， 则 必定 在 第 二 块 中 ; 然后 ， 由 ID[2].addr 找到 第 二 块 的 起 始 地 址 7， 从 该 地 址 开始 进 
行 顺 序 碍 找 ， 直 到 R[10].key=K 为 止 。 寿 给 定 值 K=30， 类 似 地 ， 先 确定 第 二 块 ， 然后， 在 
该 块 中 碍 找 ， 碍 找 不 成 功 ， 说 明 表 中 不 存在 关键 子 为 30 的 结 点 。 


10 11 12 13 14 15 16 17 18 


关键 字 地 址 。”R[1.…18] -HiTeT7 T'sTs TrsT2rT2sTa0T1713 


key addr 
ID[1..3] | 15 | 1 

35 | 7- 

61 | 13- 


图 8.3 索引 顺序 表示 例 


分 块 查找 实际 上 是 两 次 查找 过 程 ， 故 整个 算法 的 平均 查找 长 度 ， 是 两 次 查找 的 平均 查 
找 长 度 之 和 .假设 将 顺序 表 分 成 b 块 , 每 块 的 元 素 个 数 为 an(1<i<b;0<a <l Ya; =1)， 

首先 看 oi 的 选取 。 在 分 块 数 一 定时 ， 索 引 表 部 分 的 查找 效率 不 变 ， 而 所 有 块 顺序 查找 
效率 的 平声 为 (en H+o, GE [22 ， 易 知 该 式 在 各 a; 相等 时 最 小 ， 


即 每 块 均 分 时 效果 最 好 。 册 看 块 数 b 的 选取 。 设 每 块 的 元 素 个 数 为 s， 则 元 素 总 数 n=bxs 
( 若 元 素 不 能 完全 均 分 ， 那 么 前 b-1 块 中 结 点 个 数 为 下 mb |， 第 b 块 的 结 点 数 少 于 s)。 
右 对 索引 表 进 行 二 分 碍 找 以 确定 块 ， 则 分 块 查找 的 平均 查找 长 度 为 
ASLvx=ASLbent+ASLso~ log,(b+1)—1+(s+1)/2~log,(n/s+l)+s/2 

近似 取 n/s+1lxn/s， 上 式 在 s=2/ln(2)%2.89 时 有 最 小 值 ， 相 应 地 b=n/2.89。 但 这 时 块 
很 多 ， 每 块 元 素 很 少 ， 基 本 上 相当 于 稠密 索引 和 二 分 玛 找 ,“ 分 块 ” 的 意义 不 大 。 

右 对 索引 表 进 行 顺序 得 找 以 确定 块 ， 则 分 块 得 找 的 平均 得 找 长 度 为 : 

ASLa = + [2 + jr1>ya 

当 b=s= Vn 时 上 式 取 等 号 ， 即 ASLt 取 极 小 值 Yn +1。 所 以 分 块 查找 时 如 果 对 索引 表 
进行 顺序 查找 ， 则 将 数据 均 分 成 后 块 ， 每 块 的 结 点 数 为 Vn 比较 好 。 

例如 ， 奎 表 中 有 10 000 个 结 点 ， 则 应 把 它 分 成 100 个 块 ， 每 块 中 含 100 个 结 点 。 这 时 
分 块 查 找平 均 做 101 次 比较 ， 顺 序 人 找平 均 做 5 000.5 次 比较 ， 二 分 查找 平均 做 12.3 次 比 
较 ( 最 多 14 次 比较 )。 由 此 可 见 ， 分 块 得 找 算 法 的 效率 介 于 顺序 租 找 和 二 分 但 找 之 间 。 

注意 ， 在 实际 使 用 时 ， 每 块 的 大 小 不 一 定 能 做 到 相同 ， 如 一 个 学 校 的 学 生 情 况 很 目 然 
地 是 按 系 或 按 班 分 块 ， 各 系 或 各 班 的 人 数 就 不 一 定 相 同 。 另 外 ， 各 块 的 存储 区 除了 内 存 ， 
还 可 以 是 外 存 (此 时 的 块 一 般 对 应 外 存 一 个 1/O 读 写 的 物理 块 ); 各 块 也 不 一 定 都 要 放 在 同 
一 个 问 量 中 ， 还 可 将 不 同 块 放 在 不 同 的 问 量 中 。 显 然 ， 如 果 将 每 一 块 的 元 素 组 织 成 一 个 链 
表 ， 分 块 租 找 的 思想 仍然 可 以 使 用 。 

如 果 要 在 表 中 插入 或 删除 记录 ， 只 需 对 该 记录 所 在 块 进行 就 可 ， 并 且 由 于 块 内 记录 的 
存放 是 任意 的 ， 插 入 或 删除 比较 容易 ， 无 须 移动 大 量 记 录 。 这 个 特点 当 不 同 的 块 组 织 成 不 
同 的 链表 ， 或 者 组 织 到 不 同 的 癌 量 中 时 更 加 明显 (各 块 组 织 在 同一 同 量 中 时 ， 可 在 每 块 的 
后 部 预 留 一 定 空间 )。 可 见 ， 分 块 得 找 也 可 用 于 动态 和合 找 表 。 
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分 块 但 找 的 主要 代价 是 需要 增加 一 个 辅助 数组 的 存储 空间 作 索 引 表 ， 以 及 将 初始 表 整 
理 〈 划 分 ) 成 分 块 有 序 的 运算 。 


83 树 表 的 查找 


上 面 介 绍 的 3 种 得 找 法 ， 主 要 适用 于 静态 得 找 表 ， 其 中 以 二 分 得 找 效 率 最 局 ， 但 它 要 
求 表 中 结 点 按 关 键 字 有 序 。 对 于 动态 但 找 表 ， 在 采用 链表 作 存 储 结构 后 ， 虽 然 也 能 用 上 面 
提 到 的 顺序 得 找 和 分 块 租 找 ， 但 更 好 的 是 采用 本 节 将 介绍 的 几 种 特殊 的 树 或 二 又 树 作 为 表 
的 组 织 方式 ， 在 此 将 它们 统称 为 树 表 。 不 过 下 面 将 看 到 ， 建 立 树 表 的 过 程 本 喘 也 相当 于 一 
个 排序 的 过 程 。 树 表 一 般 采 用 链 式 存储 结构 以 适应 结 点 的 经 党 增加 或 删除 。 


8.3.1 二 又 排序 树 


二 义 排 序 树 (Binary Sort Tree) 义 称 为 二 叉 查 找 树 (Binary Search Tree)， 它 是 一 种 特 
殊 结 构 的 二 叉 树 ， 其 定义 为 : 二 叉 排 序 树 或 者 是 一 棵 空 树 ， 或 者 是 具有 如 下 性 质 的 二 又 树 : 

(1) 车 它 的 左 子 树 非 空 ， 则 左 子 树 上 所 有 结 点 的 键 值 均 小 于 根 结 点 的 键 值 。 

(2) 车 它 的 右 子 树 非 空 ， 则 右 子 树 上 所 有 结 点 的 键 值 均 大 于 根 结 点 的 键 值 。 

(3) 左 、 右 子 树 本 身 又 各 是 一 棵 二 叉 排 序 树 。 

按 此 定义 ， 二 又 排序 树 中 没有 键 值 重复 的 结 点 "。 

二 叉 排 序 树 有 一 个 重要 性 质 : 按 中 序 壳 历 得 到 的 中 序 序列 是 一 个 递增 有 序 序 列 。 例 如 ， 
图 8.4 所 示 的 两 棵 树 均 是 二 又 排序 树 ， 以 其 中 子 图 (a) 为 例 ， 对 其 进行 中 序 壳 历 ， 则 得 到 
有 序 序列 : 11, 33, 36, 40, 42, 55, 56, 58, 60。 


图 8.4 二 叉 排序 树 示 例 


不 难看 出 ， 前 面 讨论 的 折 半 但 找 判定 树 也 是 一 村 二 文 排序 树 。 

在 下 面 讨论 二 又 排序 树 的 操作 中 ， 使 用 二 又 链表 作为 存储 结构 。 

1. 二 义 排 序 树 的 插入 和 生成 

在 二 又 排序 树 中 插入 新 结 点 ， 只 要 保证 插入 后 仍 符合 二 又 排序 树 的 定义 即 可 。 插 入 过 


(D 有 的 文献 允许 键 值 重复 ， 比 如 将 定义 中 右 子 树 的 “大 于 ” 改 为 “大 于 或 等 于 ”， 则 键 值 可 重复 ， 
并 依次 加 右 子 树 排 列 。 这 样 以 后 中 序 遍 历时 的 重复 点 顺序 与 插入 时 一 致 ， 而 查找 时 先 找到 的 是 第 一 个 。 
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程 是 这 样 进行 的 : 大 二 又 排 序 树 为 室 ， 则 将 每 插入 结 点 *s 作为 根 结 点 插入 到 空 树 中 ; 奎 二 
又 排序 树 非 空 ， 则 将 待 插 结 点 的 关键 字 s->key 和 树 根 的 关键 字 t->key 比较 ， 戎 
s->key=t->key， 则 说 明 树 中 己 有 此 结 点 ， 无 须 插 入 ; 若 s->key<t->key， 则 将 待 插 结 点 *s 
插入 到 根 的 左 子 树 中 ， 否 则 将 x*s 插入 到 根 的 右 子 树 中 。 而 子 树 中 的 插入 过 程 又 和 在 原 树 中 
的 插入 过 程 相 同 ， 如 此 进行 下 去 ， 直 到 把 结 点 *s 作为 一 个 新 的 树叶 插入 到 二 又 排序 树 中 ， 
或 者 发 现 树 中 己 有 结 点 *s 为 止 。 
显然 上 述 搬 入 过 程 是 递归 定义 的 ， 容 易 写 出 相应 的 递归 算法 : 
bitree insert (bitree t,keytype K) {// 递 归 算 法 
pointer s; 
if (t==NULL) { // 子 树 为 空 ， 插 入 新 结 点 
s=new node; 
s—->lchild=NULL; 
s—->rchild=NULL:; 
Ss—>key=K; 
return s; 


} 


if (K==t->key) return 七 ; // 树 中 已 有 结 点 *s， 无 须 插 入 
if (K<t->key) t->lchild=insert(t->lchild,K); // 在 左 子 树 上 插入 
else t->rchild=insert (t->rchild,K); / /在 右 子 树 上 插入 


return 七 ; 
} 


注意 到 插入 过 程 是 从 根 结 点 开始 逐 层 问 下 寻找 插入 位 
置 的 ， 也 容易 写 出 非 递 归 算 法 〈 略 ) 。 

以 图 8.4 (a) 所 示 的 二 叉 排 序 树 为 例 ， 大 插入 关键 字 
为 48 的 结 点 ， 则 插入 过 程 如 图 8.5 所 示 。 由 于 插入 前 二 又 
排序 树 非 空 ， 故 将 48 和 根 结 点 42 比较 ， 因 48>42， 则 应 
将 48 插入 到 42 的 右 子 树 上 ; 又 因 42 的 右 子 树 不 空 ， 将 
48 再 和 右 子 树 的 根 60 比较 ， 因 48<60， 则 48 应 插入 到 60 
的 左 子 树 上 ; 依 此 类 推 ， 直 至 最 后 因 48<55， 且 55 的 左 子 
树 为 空 ， 故 将 48 作为 55 的 左 孩 子 插入 到 树 中 。 

二 叉 排 序 树 的 生成 ， 是 从 衬 的 二 又 排序 树 开 始 ， 每 输入 一 个 结 点 数据 ， 就 建立 一 个 新 
结 点 , 并 插入 到 当前 已 经 生成 的 二 叉 排 序 树 中 。 例如 , 设 关 键 字 的 输入 次 序 为 : 12, 20, 5, 10， 


9， 按 上 述 算法 生成 二 又 排 序 树 的 过 程 ， 如 图 8.6 所 示 。 
已 
(5) 20 
10 
9 


8.5 二 义 排 序 树 的 插入 


we 
® G@ @ 


(a) 空 树 (b) 插入 12 (c) 插入 20 (d) 插入 5 (e) 插入 10 (f) 插入 9 


8.6 ”二 叉 排 序 树 的 生成 过 程 示例 


二 义 排 序 树 的 生成 算法 如 下 : 


const keytype endflag=0; / /假设 输 入 结束 标志 为 0 
bitree creat () 1{ 

keytype KK; 

t=NULL; // 从 空 树 开始 


while (cin>>K,K!=endflag) // 读 入 结 点 关键 字 , 不 是 结束 标志 时 循环 
t=insert (t, K); 
return 七 ; 
} 


因为 二 又 排序 的 中 序 序列 是 一 个 有 序 序 列 ， 所 以 ， 对 于 一 个 任意 的 关键 字 序 列 构造 一 
柠 二 又 排 序 树 ， 其 实质 就 是 对 此 关键 子 序 列 进行 排序 ， 使 其 变 为 有 序 序列 。“ 排 序 树 ” 的 


名 称 也 由 此 而 得 。 

2. 二 又 排序 树 的 删除 

从 二 又 排序 树 中 删除 一 个 结 点 ， 不 能 把 以 该 结 点 为 根 的 子 树 都 删 去 ， 只 能 删 掉 这 个 结 
点 ， 并 且 还 要 保证 删除 后 所 得 的 二 叉 树 仍然 满足 二 叉 排序 树 的 性 质 。 也 就 是 说 ， 在 二 叉 排 
序 树 中 删 去 一 个 结 点 相当 于 删 去 有 序 序列 中 的 一 个 结 点 。 

出 除 操作 必须 首先 进行 查找 ， 以 确定 被 删 结 点 是 否 在 二 又 排序 树 中 。 若 不 在 ， 则 不 做 
任何 事情 ;否则 ， 设 待 删 结 点 为 P， 其 双亲 结 点 是 FE， 相 应 的 结 点 指针 分 别 为 p 和 了 不 妨 


设 P 为 F 的 左 孩 子 (P 为 F 的 右 孩 子 时 处 理 方法 类 似 ) ， 分 三 种 情况 : 
(1) P 为 叶 结 点 。 这 种 情况 最 和 价 单 ， 下 接 删 挥 该 结 点 (释放 其 空间 )， 并 将 其 双亲 下 的 
左 指针 置 空 ， 见 图 8.7。 


Pe 1 
六 = 入 

We f->Ichild=NULL 
(P) 人 We a 
图 8.7 二 又 排 序 树 上 删除 叶 结 点 


(2) P 只 有 一 棵 非 空子 树 。 该 子 树 可 能 是 了 的 左 子 树 ， 也 可 能 是 右 子 树 ， 但 处 理 是 相 
同 的 ， 即 令 该 子 树 为 P 的 双亲 下 的 左 子 树 ， 再 删除 结 点 P， 见 图 8.8。 


f~—>Ichild=p—>Ichild 
delete p 


(a) P 只 有 左 子 树 (b) P 只 有 右 子 树 


全 >|lchild=p 一 >rchild 
delete pp 


图 8.8 二 义 排 序 树 上 删除 只 有 一 个 子 树 的 结 点 
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(3) P 有 两 标 非 空子 树 。 这 时 可 有 多 种 处 理 方 法 。 

方法 一 : 子 树 改 接 。 将 下 的 左 指针 指 问 PL.， 将 PR 改 接 到 Pi 的 右 下 角 。 这 需 找 到 PL 
最 右 下 的 结 点 B〈 即 P 的 左 子 树 中 键 值 最 大 的 结 点 ， 它 一 定 没 有 右 孩 子 )， 让 Pa 成 为 B 的 
右 子 树 ， 见 图 8.9 (a)。 注 意 ，B 点 也 可 能 就 是 PL 的 根 A， 这 时 A 没有 石子 树 。 

类 似 地 ， 也 可 将 下 的 左 指针 指 癌 PR， 将 疡 改 接 到 Pr 的 左下 角 。 这 时 要 找 PR 最 左下 
的 结 点 C〈 即 了 的 右 子 树 中 键 值 最 小 的 结 点 ， 它 一 定 没 有 左 孩 子 )。 


人 >|child=p 一 >lchild 


二 ; q—>rchild=b 一 >Ichild q—>Ichild=b 一 >Ichild 
a Se bd p—>data=b->data p—>data=b->data 
delete b delete b 
(a) 方法 1 一 一 子 树 改 接 (b) 方法 2 一 一 等 效 删 除 
图 8.9 二 又 排序 树 上 删除 有 两 个 子 树 的 结 点 


方法 二 : 等 效 删除 。 用 了 的 中 序 前 趋 B 项 奉 P， 即 将 也 的 数据 复制 到 P 中 ,将 B 的 左 
子 树 上 接 到 其 双亲 结 点 Q 的 对 应 链 域 上 ， 然 后 删 去 B， 见 图 8.9 (b)。 

类 似 地 , 也 可 用 了 的 中 序 后 继 C 来 项 奉 P, 将 C 的 右 子 树 上 接 到 其 双 杀 结 点 Q 的 对 应 
链 域 上 ， 然 后 删 去 C。 

显然 ， 第 一 种 方法 可 能 增加 树 的 高 度 ， 不 如 后 一 种 方法 好 。 

不 难 发 现 ,情况 (1) 可 统一 到 情况 (2) 中 , 见 图 8.8(Ca), 知 P 为 叶子 , 则 p->lchild=NULL， 
语句 位 >lchild=p->lchild 也 就 是 仁 >lchild=NULL， 即 图 8.7 的 处 理 方法 。 

采用 上 述 等 效 删 除 的 删除 算法 如 下 : 


pointer del node (pointer p) { //p 指向 竺 删除 结 点 

pointer db; 

if (p==NULL) return; // 空 结 点 ， 不 存在 

if (p->rchild==NULL) { //P 只 有 左 子 树 
q=p; p=p->lchild; delete d; 

} 

else if(p->lchild==NULL) {  //P 只 有 右 子 树 
dq=p; p=p->rchild; delete q; 

} 

else { //P 有 2 个子 树 ， 等 效 删除 
q=p; b=p->lchild; 
while (b>rchild!=NULL) {qdq=b; b=b->rchild;} 
if(q!=p) q->rchild=b->rchild; 
else q->lchild=b->lchild; 
p->data=b->data; 
delete b; 


} 


return p; // 返 回 删除 后 的 子 树 ( 根 ) 
} 
该 函数 的 调用 方法 为 : 右 竺 删 结 点 P 有 双 杀 ， 假 设 它 为 双 杀 了 下 的 左 孩 子 仁 >lchild， 则 


为 位 >lchild=del node( 信 >lchild); 否则 了 为 根 ， 则 调用 为 p=dele node(p)。 这 是 因为 有 双亲 
时 可 能 要 修改 双亲 相应 的 孩子 指针 ， 而 无 双亲 时 要 返回 删除 后 的 结果 。 
3. 二 又 排 序 树 上 的 查找 
二 又 排序 树 可 看 成 一 个 有 序 表 ， 在 二 又 排序 树 上 的 查找 过 程 就 与 二 分 三 找 有 些 类 似 ， 
也 能 较 快 地 缩小 查找 范围 。 但 三 找 中 每 次 不 是 与 区 间 的 中 点 作 比 较 ， 而 是 与 根 比较 ， 由 此 
决定 下 一 步 的 搜索 范围 是 左 子 树 还 是 右 子 树 。 实 际 上 在 前 面 介绍 二 又 排 序 树 上 的 插入 和 删 
除 操作 时 就 已 使 用 了 查找 操作 。 
二 又 排 序 树 上 的 查找 算法 如 下 : 
pointer search (bitree t,keytype K) {  // 递 归 算 法 
i1f{(t==NULL) return NULL: 
1f (K== 七 ->Key) return tt; 
1f (K<t—>key) return search(t->lchild,K); 


else return search(t->rchild,K); 
} 


显然 ， 在 二 又 排 序 树 上 查找 ， 夺 查找 成 功 ， 则 是 从 根 结 点 出 发 走 了 一 条 从 根 到 待 查 结 
点 的 路 径 ; 大 得 找 不 成 功 ， 则 是 从 根 结 点 出 发 走 了 一 条 从 根 到 某 个 空子 树 的 路 径 〈 大 把 衬 
子 树 画 出 来 作 叶 子 ”, 则 也 可 说 是 走 了 一 条 从 根 到 待 查 结 点 的 路 径 )。 因 此 与 二 分 查找 类 似 ， 
关键 字 的 比较 次 数 不 超 过 树 的 高 度 。 

然而 ， 二 分 答 找 法 答 找 长 度 为 na 的 有 序 表 时 ， 其 判定 树 是 唯一 的 ， 而 含有 nn 个 结 点 的 
二 又 排序 树 却 不 唯一 。 对 于 含有 同样 一 组 结 点 的 表 ， 由 于 结 点 插入 的 先后 次 序 不 同 ， 所 构 
成 的 二 又 排序 树 的 形态 和 高 度 也 可 能 不 同 ”。 如 图 8.10 (a) 所 示 的 树 , 是 按 {12, 20, 5, 10, 9} 
的 插入 次 厅 构 成 的 ， 如 果 分 别 按 {10, 5, 20, 9, 12}、{5, 9, 10, 12, 20}、{20, 5, 12, 9, 10} 等 插 
入 次 序 则 分 别 构成 图 8.10 (b)、(c)、(d) 所 示 的 树 。 


8.10 ”关键 字 相 同 的 4 棵 二 义 排序 树 


这 4 棵 二 又 树 的 高 度 分 别 是 4、3、5 和 $， 因 此 ， 在 查找 失败 的 情况 下 ， 在 这 四 棵 树 
上 所 进行 的 关键 字 比 较 次 数 最 多 分 别 为 4、3、5 和 5; 在 查找 成 功 的 情况 下 ， 它 们 的 平均 
查找 长 度 也 会 不 同 。 对 子 图 (a)， 因 为 第 1、2、3、4 层 上 各 有 1、2、1、1 个 结 点 ， 而 找 
到 第 1 层 的 结 点 时 恰好 需 比 较 1 次 ， 所 以 ， 在 等 概率 假设 下 ， 查 找 成 功 的 平均 查找 长 上 度 为 : 


QD 这 时 的 二 又 树 称 为 扩充 二 又 树 (extended binary tree )， 显 然 为 严格 二 叉 树 。 
@ 有 些 树 是 相同 的 ， 如 {10, 5, 20, 9, 12}、{10, 5, 9, 20, 12} 等 。 
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5 
ASLa= 》 pici =(1+2x2+3x1+4x1)/5=2.4 


类 似 ， 在 等 概率 假设 下 ， 子 图 (b)、(c) 和 (d) 在 查找 成 功 时 的 平均 查找 长 度 为 : 
ASLbv=(1+2x2+3x2)/5=2.2 
ASL.c=ASLs=(1+2+3+4+5)/5=3 

可 见 ， 在 二 又 排 序 树 上 进行 查找 时 的 平均 查找 长 度 和 二 又 树 的 形态 有 关 。 在 最 坏 情 况 
下 ,二 又 树 每 一 层 只 有 一 个 结 点 ( 单 枝 树 ， 相 当 单 链表 )， 这 时 高 度 最 大 ,平均 查找 长 度 和 
单 链表 上 的 顺序 查找 相同 ， 为 +1)/2。 比 如 ， 把 一 个 有 序 表 (递增 或 递减 ) 的 n 个 结 点 依 
次 插入 而 生成 的 二 又 排序 树 就 晓 化 为 一 棵 高 度 为 nn 的 单 校 树 ( 右 单 枝 树 或 左 单 枝 树 )。 在 最 
好 情况 下 ， 二 又 排序 树 在 生成 的 过 程 中 ， 树 的 形态 比较 匀称 ， 最 终 得 到 的 是 一 棵 形态 与 二 
分 查找 的 判定 树 相 似 的 二 又 排序 树 ， 此 时 它 的 平均 查找 长 度 大 约 是 log2n 。 

若 考虑 把 n 个 结 点 , 按 各 种 可 能 的 次 序 插入 到 二 又 排序 树 中 , 则 有 nl! 棵 二 又 排序 树 (其 
中 有 的 形态 相同 )， 可 以 证 明 〈 见 习题 8.10)， 在 等 概率 的 情况 下 〈 即 每 个 关键 字 被 查 概率 
相等 )， 对 这 些 二 又 排序 树 进行 平均 ， 得 到 的 平均 查找 长 度 约 为 1.39log,n ， 即 仍然 是 
O( log,n )。 

这 个 问题 也 可 这 样 理 解 : 在 二 又 排序 树 的 生成 过 程 中 ， 要 多 次 进行 关键 字 比 较 。 每 次 
新 结 点 与 已 有 结 点 比较 后 决定 放 到 其 左边 或 右边 。 如 果 把 已 有 结 点 看 成 “基准 ”， 则 不 难 
看 到 ， 这 个 过 程 与 快速 排序 的 划分 实际 是 相同 的 (基准 取 为 序列 的 第 一 个 ) ， 不 同 的 是 快 
速 排 序 是 在 所 有 数据 已 齐备 时 进行 的 ， 而 二 又 排序 树 是 每 出 现 一 个 结 点 就 处 理 一 下 。 所 以 
利用 快速 排序 的 分 析 结 果 ， 马 上 得 到 : n 个 结 点 的 二 叉 排 序 树 在 生成 过 程 中 ， 关 键 字 比较 
次 数 平 均 约 为 1.39nlog2n 。 

就 平均 性 能 而 言 ， 二 又 排序 树 上 的 查找 和 二 分 查找 相差 不 大 ， 并 且 二 又 排序 树 上 的 插 
入 和 删除 结 点 十 分 方便 ， 无 须 移动 大 量 结 点 。 因 此 ， 对 于 需要 经 常 做 插入 、 删 除 和 查找 运 
算 的 表 ， 宜 采用 二 又 排序 树 结构 。 由 此 ， 人 们 也 常常 将 二 又 排 序 树 称 为 二 又 查 找 树 。 

若 各 结 点 的 查找 概率 不 同 ， 则 平均 检索 长 度 最 小 的 二 又 排 序 树 称 为 最 优 二 又 排序 树 。 
显然 ,查找 概 率 高 的 结 点 应 离 根 较 近 ,但 实际 构造 比较 困难 (通常 采用 近似 算法 )。 为 了 保 
持 最 优 ， 插 入 、 删 除 不 方便 ， 故 一 般 并 不 用 于 动态 检索 。 

最 后 需要 指出 ， 二 又 排 序 树 一 般 并 不 直接 用 来 排序 ， 因 为 建立 二 又 排序 树 时 要 花费 一 
定时 间 〔 比 较 次 数 为 O(n )~~O(nlogzn)， 取 决 于 树 的 形态 )， 且 占用 空间 大 (每 个 结 点 需 两 
个 附加 指针 )， 最 后 为 了 得 到 排序 序列 还 要 遍历 ， 不 如 前 一 章 介 绍 的 各 种 排序 算法 好 。 


8.3.2 ”平衡 二 义 排 序 树 


从 上 节 的 讨论 可 知 ， 二 又 排 序 树 的 查找 效率 取决 于 树 的 形态 ， 而 构造 一 村 形态 匀称 的 
二 又 排 序 树 与 结 点 插入 的 次 序 有 关 。 但 是 结 点 插入 的 先后 次 序 往往 不 是 了 湖人 的 意志 而 定 的 ， 
这 了 驶 要 求 我 们 找到 一 种 动态 平衡 的 方法 ， 对 于 任意 给 定 的 关键 字 序 列 都 能 构造 一 柠 形 态 勾 
称 的 二 又 排序 树 。 

我 们 把 形态 匀称 的 二 又 树 称 为 平衡 二 叉 树 (Balanced Binary Tree)， 显 然 其 中 任 一 结 点 
的 左右 子 树 的 高 度 应 该 大 致 相同 。 一 般 只 要 二 又 树 的 高 度 为 O(logsn ) 束 可 看 成 是 平衡 的 ， 
所 以 平衡 二 又 树 有 多 种 。 本 节 讨 论 的 平衡 二 又 树 是 指 AVL 树 : 或 者 为 空 ， 或 者 是 任何 结 点 


的 左 、 右 子 树 高 上 度 相 差 不 超过 1 的 二 叉 树 。 二 又 树 上 任 一 结 点 的 左 、 右 子 树 高 度 之 差 ， 称 
为 该 结 点 的 平衡 因子 (Balanced Factor) “”“。 因 此 , 平衡 二 叉 树 上 所 有 结 点 的 平衡 因子 只 可 
能 是 -1]、0、1。 换 言 之 ， 若 一 棵 二 又 树 上 任 一 结 点 的 平衡 因子 的 绝对 值 都 不 大 于 1， 则 为 
平衡 二 又 树 。 

例如 ,图 8.11 中 子 图 (a) 是 一 柠 平 衡 二 叉 树 ， 而 子 图 (b) 中 有 平衡 因子 为 -2 的 结 点 ， 
故 不 是 平衡 二 又 树 ， 图 中 结 点 内 的 数字 是 平衡 因子 。 


(a) 平衡 二 又 树 (b) 不 平衡 二 又 树 


图 8.11 平衡 和 不 平衡 二 叉 树 示例 


任何 一 棵 二 又 排序 树 ， 都 可 以 转化 为 一 柠 平 衡 二 又 排序 树 。 事 实 上 ， 折 半 答 找 的 判定 
树 就 是 一 棵 平衡 二 又 树 ， 所 以 ， 对 任 一 棵 二 又 排 序 树 ， 我 们 可 将 它 的 排序 序列 按 折 半 查找 
判定 树 的 生成 方法 ， 组 织 成 一 棵 二 又 树 ， 它 显然 是 二 又 排 序 树 ， 且 是 平衡 二 又 树 。 该 性 质 
的 意义 在 于 指出 了 平衡 二 又 排序 树 的 存在 性 ， 同 时 也 指出 了 它 的 一 种 构造 方法 ， 但 这 是 一 
种 完全 重新 构造 的 方法 ， 不 适合 于 动态 构造 。 

如 何 构造 出 一 棵 平衡 的 二 又 排序 树 昵 ? Adelson-Velskii 和 Landis 等 人 在 1962 年 提出 
了 一 个 动态 地 保持 二 又 排 序 树 平衡 的 方法 ，AVL 树 即 因此 得 名 。 其 基本 思想 是 : 在 构造 二 
又 排序 树 的 过 程 中 ， 每 插入 一 个 结 点 ， 束 检查 是 否 因 插 入 而 破坏 了 树 的 平衡 性 ， 硅 是， 则 
找 出 其 中 最 小 不 平衡 子 树 ， 在 保持 排序 树 特性 的 前 提 下 ， 调 整 最 小 不 平衡 子 树 中 各 结 点 之 
间 的 连接 关系 ， 以 达到 新 的 平衡 。 

所 谓 最 小 不 平衡 子 树 是 指 : 以 离 插入 结 点 最 近 、 且 平衡 因子 绝对 值 大 于 1 的 结 点 作 根 
的 子 树 。 为 了 简化 讨论 ， 不 妨 假 设 二 又 排序 树 的 最 小 不 平衡 子 树 的 根 结 点 是 A〈 结 点 B、 
C 的 含义 见 相 应 的 图 示 )， 调 整 该 子 树 的 规律 可 归纳 为 下 列 4 种 情况 。 

(1) LL 型 调整 

失衡 原因 : 在 A 的 左 孩 子 (LL) 的 左 子 树 (L) 上 插入 结 点 , 使 A 的 平衡 因子 由 1 变 为 2 (B 
的 平衡 因子 由 0 变 为 1)。 

调整 操作 :“ 提 升 ”B 为 新 子 树 的 根 A 下 降 为 B 的 右 孩 子 ， 同 时 将 B 原来 的 右 子 树 
BR 调整 为 A 的 左 子 树 ， 见 图 8.12 (a) 所 示 ， 图 中 市 阴影 的 小 框 表示 被 插入 的 结 点。 

(2) RR 型 调整 

失衡 原因 : 在 A 的 右 孩 子 (R) 的 右 子 树 (R) 上 插入 结 点 ， 使 A 的 平衡 因子 由 -1 变 为 -2 
(B 的 平衡 因子 由 0 变 为 -1)。 

调整 操作 :“ 提 升 ”B 为 新 子 树 的 根 A 下 降 为 B 的 左 孩 子 ， 同 时 将 B 原来 的 左 子 树 
Br 调整 为 A 的 右 子 树 ， 见 图 8.12 (b〉 所 示 。 


G 即 左 子 树 局 度 - 右 子 树 局 上 度 。 有 的 文献 定义 为 右 子 树 启 度 - 左 子 树 局 度 。 
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(3) LR 型 调整 

失衡 原因 : 在 A 的 左 孩 子 (L) 的 右 子 树 (R) 上 插入 结 点 , 使 A 的 平衡 因子 由 1 变 为 2 (B 
的 平衡 因子 由 0 变 为 -1 )。 

调整 操作 :“ 提 升 ”C 为 新 子 树 的 根 A 下 降 为 C 的 右 孩 子 (B 变 为 C 的 左 孩子 )， 同 
时 将 C 原来 的 左 子 树 Cr 调整 为 了 的 右 子 树 , C 原来 的 右 子 树 CR 调整 为 A 的 左 子 树 , 见 图 
8.12 (c) 所 示 〈 插 入 点 也 可 能 在 Cr 中 ， 此 时 C 的 平衡 因子 为 -1; 插入 点 也 可 能 就 是 C， 
此 时 C 为 新 结 点 ，Cr、CR 为 空 ， 但 调整 操作 相同 )。 

(4) RL 型 调整 

失衡 原因 : 在 A 的 右 孩 子 (R) 的 左 子 树 (L) 上 插入 结 点 ， 使 A 的 平衡 因子 由 -1 变 为 -2 
(B 的 平衡 因子 由 0 变 为 1)。 

调整 操作 :“ 提 升 ”C 为 新 子 树 的 根 A 下 降 为 C 的 左 孩 子 (B 变 为 C 的 右 孩 子 )， 同 
时 将 C 原来 的 左 子 树 Cr 调整 为 A 的 右 子 树 , C 原来 的 右 子 树 CR 调整 为 了 的 左 子 树 , 见 图 
8.12 (d) 所 示 〈 插 入 点 也 可 能 在 Cr 中 ， 此 时 C 的 平衡 因子 为 -1; 插入 点 也 可 能 就 是 C， 
此 时 C 为 新 结 点 ，Cr、CR 为 空 ， 但 调整 操作 相同 )。 

易 见 ， 这 四 种 情况 实际 上 只 有 两 种 是 独立 的 ， 因 为 RR 与 LL 对 称 、RL 与 LR 对 称 。 


(c) LR 型 调整 (d) RL 型 调整 


图 8.12 AVL 树 的 四 种 平衡 调整 示意 图 


在 上 述 的 调整 操作 中 ， 仅 需 改 变 少 量 的 指针 ， 而 且 调整 后 新 子 树 的 高 度 和 插入 前 子 树 
的 高 度 一 样 ， 因 此 ， 无 须 考 夸 变 动 最 小 不 平衡 子 树 之 外 的 结 点 ， 就 可 完成 对 整个 二 又 排序 
树 的 平衡 。 另 外 ， 调 整 前 后 叶子 结 点 从 左 到 右 的 相对 次 序 保持 不 变 。 全 于 调整 的 正确 性 ， 
可 简单 地 检验 中 序 序列 是 否 仍然 递增 有 订 即 可 。 

下 面 简单 介绍 一 下 AVL 树 的 插入 算法 。 显 然 ，AVL 树 的 插入 算法 应 在 二 又 排序 树 插 
入 算法 基础 上 扩充 以 下 功能 : 


(1) 判断 插入 结 点 后 是 售 失 衡 。 

(2) 在 是 ， 寻 找 最 小 失衡 子 树 并 转 〈3 )。 

(3) 判断 失衡 类 型 并 做 相应 调整 。 

易 知 ,失衡 的 判断 可 以 与 寻找 最 小 失衡 子 树 结合 起 来 (一 棵 AVL 树 失衡 当 且 仅 当 它 有 
失衡 子 树 )。 而 一 棵 子 树 是 否 失 衡 可 由 它 根 结 点 的 平衡 因子 的 绝对 值 是 否 大 于 1 决定 。 进 一 
步 ， 如 果 失 衡 ， 最 小 失衡 子 树 的 根 一 定 是 离 插 入 结 点 最 近 且 插入 前 平衡 因子 的 绝对 值 为 1 
(因而 插入 后 才 可 能 大 于 1) 的 结 点 。 这 样 ， 寻 找 最 小 失衡 子 树 的 过 程 可 以 进一步 与 寻找 新 
结 点 的 插入 位 置 的 过 程 结 合 起 来 。AVL 树 插入 算法 的 基本 步骤 如 下 : 

(1) 在 寻找 新 结 点 的 插入 位 置 的 过 程 中 ， 记 下 离 该 位 置 最 近 且 平衡 因子 不 等 于 0 的 结 
点 A， 它 是 可 能 出 现 的 最 小 失衡 子 树 的 根 。 

(2) 修改 目 该 结 点 到 插入 位 置 路 径 上 所 有 结 点 的 平衡 因子 ， 其 他 结 点 的 平衡 因子 不 受 
影响。 

(3) 判断 插入 结 点 后 ， 结 点 A 的 平衡 因子 的 绝对 值 是 侍 大 于 1， 夺 是， 进一步 判断 失 
衡 类 型 并 作 相 应 的 调整 ， 否 则 本 次 插入 过 程 结束 。 

算法 中 要 用 到 结 点 的 平衡 因子 ， 可 在 二 又 树 的 每 个 结 点 中 增加 一 个 平衡 因子 域 ， 具 体 
算法 这 里 从 略 。 

易 见 ， 高 度 为 h 的 AVL 树 结 点 数 最 少时 ， 其 两 个 子 树 的 高 度 分 别 为 h-1 和 h-2， 且 子 
树 的 结 点 数 也 最 少 , 于 是 nt=nnr_i+nh 2z+1， 即 Anh+l)=(COnhi+l)+On2+l， 所 以 最 少 结 点 数 nh+1 


与 对 应 的 Fibonacci 数 相 同 : mF (0 本 h >0)( 见 附录 EE)。 据 此 可 知 : 
S 


含有 n 个 结 点 的 AVL 树 ， 树 的 高 度 最 大 约 为 log,(V5(n+1)) -2x1.44logsn 。 实 际 AVL 树 
的 结 点 分 布 基本 不 会 如 此 稀疏 ， 高 度 多 数 是 接近 理想 平衡 时 的 logn 。 可 以 证 明 ， 平 均 高 
度 为 O(log,n) 。 

在 AVL 树 上 查找 时 ， 和 关键 字 比 较 的 次 数 不 会 超过 树 的 高 度 ， 且 不 会 出 现 赔 变 为 单 枝 
树 的 情形 ， 因 此 ， 查 找 AVL 树 的 时 间 复 杂 度 是 O(logyn )。 然 而 ， 动 态 平衡 过 程 需 花费 不 
少时 间 ， 故 在 实际 应 用 中 是 否 采用 AVL 树 ， 还 要 根据 具体 情况 而 定 。 一 般 情 况 下 ， 若 结 点 
关键 字 是 随机 分 布 的 ， 并 且 系 统 对 平均 查找 长 度 没有 苛求 ， 则 不 必 使 用 平衡 二 又 排序 树 。 

与 插入 操作 类 似 , 在 删除 操作 时 AVL 树 也 可 能 失去 平衡 而 需要 调整 , 但 每 次 插入 时 最 
小 不 平衡 子 树 调整 后 树 的 其 他 部 分 不 受 影响 〈 仍 平衡 )， 故 最 多 调整 一 次 ; 而 每 次 删除 时 当 
前 最 小 不 平衡 子 树 调整 后 可 能 沿 根 的 方向 产生 新 的 最 小 不 平衡 子 树 ， 又 要 调整 ， 即 可 能 
从 最 初 的 最 小 不 平衡 子 树 向 根 调整 多 次 ， 但 最 多 O(logjn ) 次 ， 具 体 略 。 


8.3.3 B 树 ? 


全 此 ， 我 们 讨论 的 得 找 算 法 都 是 内 碍 找 算 法 ， 这 是 因为 被 得 找 的 数据 都 是 保存 在 内 存 
中 的 。 它 们 适用 于 较 小 的 碍 找 表 ， 而 对 较 大 的 、 存 放 在 外 存储 右上 的 文件 丈 不 合适 了 。 例 
如 ， 当 用 平衡 二 又 树 作为 磁盘 文件 的 索引 组 织 时 ， 知 以 结 点 作为 内 、 外 存 交 换 的 单位 ， 则 


(D 有 文献 写 做 B 树 、B_ 树 、B- 树 、B- 树 等 〈 不 能 读 做 “B 减 树 ”英文 为 B-tree， 中 间 为 连 字 符 )。 
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查找 到 需要 的 关键 字 之 前 ， 平 均 要 对 磁盘 进行 log2n 次 访问 ， 这 是 很 费时 间 的 。 
为 了 减少 访 外 次 数 ， 需 要 降低 得 找 树 的 高 度 ， 这 可 采用 多 又 树 ， 特 别 是 平衡 多 又 树 。 
为 此 ，1972 年 ，R.Bayer 和 E.M.McCreight 提出 了 一 种 适用 于 外 查找 的 B 树 ， 它 是 一 种 平 


衡 多 又 树 ， 每 个 结 点 存放 多 个 关键 字 。B 树 常 用 作 索 引 ， 在 文件 系统 和 数据 库 系 统 中 获得 
过 重要 应 用 。 


1. B 树 的 定义 

一 棵 m 阶 的 B 树 ,或 者 为 空 树 ， 或 者 为 满足 下 列 条 件 的 m 又 树 : 

(1) 根 至 少 两 个 孩子 。 

(2) 除根 之 外 ， 每 个 内 部 结 点 至 少 | my/2 | 个 孩子 (最 多 m 个 孩子 )。 

(3) 除 叶 子 外 ， 每 个 结 点 的 关键 字 从 小 到 大 排列 ， 孩 子 数 比 关键 字 个 数 多 1。 

(4) 所 有 叶子 在 同一 层 ， 叶 子 不 含 任 何 关 键 字 信 息 〈 实 际 为 树 中 并 不 存在 的 外 部 结 点 ， 
且 指 向 这 些 外 部 结 点 的 指针 为 空 )。 

以 上 条 件 (1) 实际 上 是 多 余 的 ， 因 为 只 要 (内 部 ) 结 点 存在 ， 它 必 仿 关键 字 ， 而 即 
使 一 个 关键 字 也 有 两 个 孩子 。 如 果 B 树 的 阶 为 2， 则 每 个 结 点 最 多 和 最 少 都 是 两 个 孩子 ， 
于 是 每 个 结 点 都 有 两 个 孩子 ， 而 叶子 在 同一 层 ， 使 得 2 阶 B 树 只 能 是 满 二 又 树 。3 阶 B 树 
也 称 为 2 一 3 树 ， 因 为 每 个 内 部 结 点 有 2 个 或 3 个 孩子 。 

条 件 (1) 也 使 B 树 不 至 于 一 开始 就 偏向 一 边 ; 条 件 〈2) 使 每 个 结 点 至 少 半 满 条 件 
(4) 中 叶子 都 在 同一 层 ， 使 B 树 高 度 上 平衡 ;条件 (3) 中 结 点 关键 字 递增 排列 ， 使 B 树 
有 某 种 “中 序 ” 递 增 性 ， 可 看 成 二 叉 排 序 树 的 扩充 ， 是 一 种 平衡 多 又 排序 树 。 由 于 N 个 关 
键 字 查找 失败 的 情况 有 N+l 种 (分 别 对 应 关键 字 之 间 的 区 间 )， 所 以 B 树 中 叶子 数 比 树 中 
全 部 关键 字 个 数 多 1。 

例如 ， 图 8.13 所 示 的 树 是 一 棵 m=5 阶 的 B 树 ， 其 高 度 为 4。 叶 结 点 用 圆圈 表示 ， 不 
含 任何 信息 ， 都 在 第 4 层 。 其 他 结 点 用 矩形 表示 ， 里 面 的 数字 为 关键 字 。 根 结 点 有 两 个 孩 
子 ， 包 含 一 个 关键 字 。 其 他 非 叶 结 点 的 孩子 个 数 在 | m/2 上 F3 到 5 之 间 ， 相 应 地 ， 结 点 所 包 


含 的 天 键 字 个 数 在 2 到 4 之 间 。 在 每 个 非 叶 结 点 中 ， 关 键 学 是 按 递 增 顺 序 排列 的 ， 且 该 
子 ) 指针 的 数目 比 该 结 点 的 关键 子 个 数 多 1 个。 
-30_ 
妥 ? 和 3 
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图 8.13 一 棵 5 阶 的 B 树 


在 B 树 中 包含 ] 个 关键 学 \J+1 个 指针 的 结 点 ,一 般 形式 为 (Po, Ki, Pi, K;, …, P;1, K;, P;)。 
其 中 ,Ki 是 关键 宁 ， 且 K1<K2<…<Kj; pi 是 指针 , 指 问 包含 Ki 到 Ki 之 间 的 关键 字 的 子 树 。 
例如 图 8.13 所 示 的 B 树 , 根 结 点 有 两 个 指针 , 一 个 指 问 包含 小 于 30 的 那些 关键 字 的 子 树 ， 
男 一 个 指 问 包含 大 于 30 的 那些 关键 字 的 子 树 。 


实际 上 ， 结 点 中 每 个 关键 字 本 身 还 需要 一 个 指 癌 其 所 在 记录 位 置 的 指针 。 另 外 ， 在 下 
面 将 看 到 , 在 B 树 中 插入 和 删除 时 可 能 要 向 上 访问 , 故 结 点 中 一 般 还 要 增加 一 个 双亲 指针 。 
在 操作 中 ， 还 可 使 B 树 结 点 的 大 小 填 满 一 个 磁盘 块 ， 这 样 结 点 中 的 (孩子 ) 指针 就 是 孩子 
结 点 所 在 的 块 号 。 

2. B 树 的 运算 

(1) 查找 

在 B 树 中 查找 给 定 关 键 字 的 方法 是 : 从 根 结 点 开始 ， 在 根 结 点 所 包含 的 关键 字 Ki、 
K2、…、Ki 中 查找 给 定 的 关键 字 ， 考 找到 则 查找 成 功 ; 和 否则， 一定 可 以 确定 要 查 的 关键 字 
是 在 某 个 Ki 和 Kiri 之 间 ( 因 为 结 点 内 的 关键 字 是 有 序 的 )， 于 是 ， 取 pi 所 指 问 的 子 树 继 续 
查找 。 如 此 重复 下 去 ， 直 到 查找 成 功 或 指针 pi 为 室 〈 对 应 叶子 结 点 ) 时 ， 查 找 失 败 。 

显然 ， 若 每 个 结 点 只 有 一 个 关键 字 ， 则 查找 过 程 与 二 又 排序 树 基本 相同 。 在 每 个 结 点 
中 找 关 键 字 时 ， 由 于 各 关键 字 是 有 序 的 ， 既 可 顺序 查找 ， 也 可 二 分 查找 。 

上 述 查 找 过 程 包含 两 种 基本 操作 : 在 B 树 上 找 结 点 ; 在 结 点 中 找 关 键 字 。 由 于 B 树 通 
党 存储 在 磁盘 上 ， 则 前 一 查找 是 在 磁盘 上 进行 的 ， 读 入 结 点 的 信息 后 ， 后 一 查找 在 内 存 中 
进行 。 由 于 访 外 (磁盘 〉 比较 耗 时 ， 所 以 , 在 B 树 上 找 结 点 的 效率 可 用 来 衡量 B 树 的 查找 
效率 。 在 B 树 上 找 结 点 时 所 需 比 较 的 次 数 就 是 该 结 点 在 B 树 中 的 层 数 。 

以 最 坏 情 况 为 例 ， 即 待 查 结 点 在 B 树 的 最 低层 L 上 〈 非 叶子 层 )， 我 们 来 看 看 B 树 的 
查找 效率 。 设 m 阶 B 树 包含 N 个 关键 字 ， 则 第 L+1 层 有 N+1l 个 叶 结 点 。 第 一 层 为 根 ， 至 
少 一 个 结 点 ; 根 至 少 有 两 个 孩子 ， 故 第 二 层 至 少 两 个 结 点 。 除 根 和 叶 结 点 之 外 ， 其 他 结 点 
至 少 有 |m/2 | 个 孩子 ， 因 此 ， 第 三 层 至 少 有 2X| my/2 | 个 结 点 ， 第 四 层 至 少 有 2X[m/2 |- 个 
结 点 ，……… ， 那 么 第 L+1 层 至 少 有 2X|m21” 个 结 点 ， 于 是 有 N+t1=2X|m21”， 即 : 

L<1+1ogr,1 ((N+1)/2) 

这 也 是 B 树 的 最 大 高 度 。 这 个 结果 比 平衡 二 又 排序 树 的 logn 好 得 多 ， 因 为 一 般 
| my/2 |>>2。 只 要 阶 数 m 足够 高 ， 查 找 B 树 结 点 的 次 数 是 可 以 很 低 的 ， 如 以 m=199 为 例 ， 
即使 N=1 999 999， 则 工 至 多 等 于 4。 由 于 对 B 树 的 一 次 查找 至 多 进行 LL 次 存 取 ， 这 个 公 
式 保证 了 B 树 的 高 效率 查找 。 

类 似 可 知 也 树 的 最 小 高 度 工 = log。(N+1)。 

(2) 插入 

在 了 B 树 中 插入 关键 字 时 ， 要 先进 行 查找 ， 大 树 中 已 有 该 关键 字 则 不 再 插入 ; 肴 是 一 个 
新 关键 字 ， 则 查找 一 直 进 行 到 最 底层 也 找 不 到 。 设 叶 结 点 为 第 L+1 层 ， 则 新 插入 的 关键 字 
总 是 进入 第 工 层 的 结 点 。 这 与 二 又 排序 树 不 同 ， 后 者 插入 的 结 点 可 分 布 在 各 层 。 

设 B 树 的 阶 为 m， 则 每 个 结 点 关键 字 的 个 数 最 多 为 m-l 个 。 大 要 插入 的 结 点 关键 字 
个 数 少 于 m1 个 ， 则 插入 过 程 仅 局 限于 该 结 点 ， 只 要 把 新 关键 字 直 接 插入 该 结 点 即 可 。 

车 要 插入 的 结 点 已 有 mr-1l 个 关键 字 ， 则 插入 后 关键 字 的 个 数 将 超过 允许 的 最 多 个 数 
m-1， 这 时 要 将 该 结 点 分 裂 为 两 个 ， 并 把 中 间 关 键 字 提升 到 双亲 结 点 里 去 〈 使 分 裂 后 的 两 
个 结 点 大 小 相当 ， 都 约 半 满 )。 如 果 双 亲 结 点 原来 也 是 满 的， 就 需要 继续 分 裂 和 提升 。 最 坏 
情况 是 这 个 过 程 一 直 传播 到 根 。 者 根 也 需要 分 裂 ， 由 于 它 没有 双亲 ， 则 要 另外 建立 一 个 新 
的 根 结 点 ， 整 个 B 树 就 增加 了 一 层 。 
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例如 ， 在 图 8.13 的 5 阶 B 树 中 插入 关键 字 60， 被 插入 结 点 的 关键 字 个 数 原来 就 有 最 
多 允许 的 4 个 ， 插 入 后 就 会 有 5 个 : (43, 47, 55, 59, 60)， 对 该 结 点 分 裂 ， 提 升 中 间 关 键 字 
55 到 双亲 结 点 ， 结 果 双 亲 结 点 又 要 分 裂 ， 最 后 结果 如 图 8.14 所 示 “。 
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图 8.14 在 图 8.13 上 插入 关键 字 60 引起 结 点 分 裂 


可 见 ，B 树 的 插入 及 其 调整 是 从 下 同上 进行 的 。 

如 果 通 过 插入 的 方法 生成 B 树 ， 则 B 树 将 是 从 故 部 问 上 生长 的 。 

(3) 删除 

删除 关键 字 时 也 要 先进 行 租 找 。 奋 删除 的 关键 字 不 在 第 工 层 ， 则 先 把 该 关键 字 与 它 在 
第 工 层 的 后 继 (或 前 趋 ) 交换 位 置 〈 注 意 后 继 、 前 趋 总 在 第 工 层 )， 然 后 在 第 工 层 中 删除 
该 关键 字 。 这 样 便于 删除 后 对 结 点 从 下 癌 上 调整 〈 与 插入 类 似 )。 例 如 ， 在 图 8.14 的 了 树 
中 删除 关键 字 70， 它 不 在 最 底层 ， 则 先 找到 70 的 后 继 73， 交 换 两 者 位 置 ， 然 后 再 删除 70， 
结果 如 图 8.15 (a) 所 示 。 

删除 第 工 层 的 关键 字 后 ， 可 能 导致 所 在 结 点 的 关键 字 个 数 少 于 | my/2 1 (不 足 半 满 )。 
这 时 要 在 该 结 点 左 或 右 兄弟 结 点 中 移动 硅 干 个 关键 字 到 该 结 点 中 来 (其 中 最 小 或 最 大 的 关 
键 字 要 提升 到 双亲 结 点 ， 双 杀 结 点 相应 的 一 个 关键 字 要 移动 下 来 ， 这 相当 于 移动 是 通过 双 
杀 弓 行 的 )， 使 两 个 结 点 所 含 天 键 字 个 数 基本 相同 。 奋 兄弟 结 点 的 关键 字 个 数 也 很 少 , 刚好 
等 于 | m/2 1， 就 不 能 进行 这 种 移动 ， 这 时 要 把 该 结 点 、 它 的 兄弟 结 点 以 及 它们 双亲 结 点 
中 相应 的 一 个 关键 字 合 并 为 一 个 结 点 。 但 从 双亲 结 点 中 拿 走 一 个 关键 字 后 ， 双 杀 结 点 本 身 


可 能 又 要 合并 ， 有 时 这 种 合并 可 一 直 传 播 到 根 结 点 ;特别 地 ， 如 果 传 播 到 根 而 根 结 点 只 包 
售 一 个 关键 子 ， 则 根 结 点 关键 学 下 移 与 它 的 两 个 孩子 合并 后 ， 形 成 的 是 新 的 根 结 点 ， 整 个 


树 就 减少 了 一 层 。 

例如 ， 从 图 8.15(a) 中 删除 10， 这 使 原 包 含 关 键 字 10 的 结 点 只 剩 下 一 个 关键 字 ， 即 
小 于 半 满 所 需 的 | m/2 1= 了 | S/2 -1=2。 于 是 需要 从 右边 兄弟 结 点 移 一 个 关键 字 15 到 该 结 点 
来 , 但 这 又 涉及 它们 双亲 结 点 中 的 关键 字 12 也 要 作 相 应 变化 , 所 以 ， 实 际 上 是 将 右 兄 弟 中 
关键 字 15 上 移 到 双亲 结 点 ， 而 把 双亲 中 关键 字 12 下 移 到 原来 包含 10 的 结 点 ， 如 
图 8.1$ (b) 所 示 。 

如 果 在 图 8.15 (b) 中 再 删除 关键 字 19， 则 删除 19 后 ， 原 包含 19 的 结 点 只 剩 下 一 个 
关键 字 22， 并 且 它 的 左 、 右 兄弟 结 点 包含 的 关键 字 也 很 少 ， 了 刚好 等 于 半 满 
| my/2 六] 二 5/2 上 -1=2， 于 是 ， 把 原 包含 22 的 结 点 、 它 的 右 兄 弟 结 点 及 它们 双亲 结 点 中 的 关 


QD 该 图 是 4 阶 的 ， 小 于 原来 的 5$ 阶 。 也 即 在 插入 、 删 除 等 运算 后 ，B 树 的 阶 数 可 能 《临时 性 ) 变 小 。 
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键 字 25 合并 成 一 个 新 结 点 。 从 双亲 结 点 中 拿 出 一 个 关键 字 后 ,双亲 结 点 本 和 喘 又 要 进行 合并 ， 
最 后 结果 如 图 8.15 (c) 所 示 。 
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(a) 在 图 8.14 上 删除 关键 字 70 


(b) 在 图 (a) 上 删除 关键 字 10， 引 起 关键 字 移动 


05 12 22 25 26 28 | | 35 39 | 吧 可 加 [可 | 纯 65 68 77 81 | | 88 93 
羡 国有 矶 Ry 


co 在 图 @&) 上 删除 关键 字 19， 引起 结 点 合并 
8.15 删除 关键 字 时 B 树 结 点 的 几 种 变化 情况 


8.3.4 B 树 


上 一 节 介 绍 的 B 树 在 文件 系统 上 的 应 用 实际 上 并 不 多 ， 普 遇 使 用 的 是 它 的 一 个 称 为 
B 树 的 变型 树 。 一 棵 m 阶 的 B 树 和 m 阶 的 B 树 的 差异 是 ”: 

(1) 有 卡 个 孩子 的 结 点 必 有 个 关键 学 〈 叶 结 点 的 孩子 是 外 部 结 点 )。 

(2) 上 面 各 层 结 点 中 的 关键 学 , 均 是 下 一 层 相 应 结 点 中 最 大 (或 最 小 ) 关键 字 的 复写 ， 
即 上 层 结 点 是 下 层 结 点 的 索引 。 

(3) 所 有 关键 字 均 出 现在 叶 结 点 上 ， 叶 结 点 包含 了 全 部 关键 字 的 信息 及 指 癌 相应 记录 


(D 有 的 文献 定义 了 男 一 种 B+ 树 : 除了 包含 全 部 关键 字 的 叶子 层 外 ， 上 面 各 层 的 索引 结构 同 前 述 B 
树 。 但 这 样 定 义 的 B+ 树 有 的 文献 也 称 做 B 树 。 
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的 指针 ， 且 叶子 结 点 本 和 喘 依 照 关 键 字 的 大 小 ， 按 从 小 到 大 的 顺序 链接 。 

图 8.16 是 一 棵 3 阶 B 树 ， 注 意 其 高 度 为 3。 

通常 B 树 上 有 两 个 头 指针 , 一 个 指向 根 结 点 , 另 一 个 指向 关键 字 最 小 的 叶 结 点 。 因此， 
可 以 对 B 树 进行 两 种 查找 运算 : 一 种 是 从 最 小 关键 字 起 顺序 查找 ; 另 一 种 是 从 根 结 点 开始 
进行 随机 查找 。 


/ root (随机 查找 ) 


8.16 一 棵 3 阶 的 B 树 


与 B 树 类 似 ，B 树 的 构造 也 是 由 下 而 上 进行 的 ，m 限定 了 结 点 的 大 小 。 

在 B 树 上 进行 随机 查找 、 插 入 和 删除 的 过 程 ， 基 本 上 与 B 树 类 似 。 只 是 在 查找 时 ， 若 
非 终 端 结 点 上 的 键 值 等 于 给 定 值 ， 并 不 终止 查找 过 程 ， 而 是 继续 向 下 查找 直至 叶 结 点 。 
此 ,在 B 树 中 ， 不 管 查找 成 功 与 否 ， 每 次 查找 都 是 走 了 一 条 从 根 到 叶 结 点 的 路 径 。 

B 树 的 插入 仅 在 叶 结 点 上 进行 。 当 结 点 中 的 关键 字 个 数 大 于 m 时 要 分 裂 成 两 个 结 点 ， 
它们 所 含 关键 字 的 个 数 分 别 为 | m+l)/2 | 和 [(m+1)/2]， 并 且 ， 它 们 的 双亲 结 点 中 应 同时 包 
含 这 两 个 结 点 的 最 大 关键 字 。 

B 树 的 删除 也 仅 在 叶 结 点 上 进行 。 当 叶 结 点 中 的 最 大 关键 字 被 删除 时 ， 其 在 非 终端 结 
点 中 的 值 可 以 作为 一 个 “分 界 关键 字 ” 存 在 〈 即 不 必修 改 为 新 值 )。 若 因 删 除 而 使 结 点 中 关 
键 字 的 个 数 少 于 | m/2 | 时 ， 则 要 和 该 结 点 的 兄弟 结 点 进行 合并 。 

B 树 广泛 地 使 用 在 包括 VSAM 文件 在 内 的 多 种 文件 系统 中 , 其 中 每 个 叶子 的 关键 字 一 
般 不 是 对 应 一 个 记录 【稠密 索引 )， 而 是 对 应 一 个 页 块 ( 稀 玖 索引 )。 也 正 是 由 于 使 用 的 广 
泛 性 ， 对 其 改进 也 有 较 大 的 意义 。 一 种 改进 方法 是 B* 树 , 它 是 B 树 的 变 体 ， 除 了 分 裂 和 合 
并 结 点 的 规则 不 同 外 ， 二 者 完全 相同 。B 树 在 结 点 关键 字 过 多 时 ， 并 不 马上 分 裂 ， 而 是 先 
将 一 些 记录 分 给 相 邻 的 兄弟 结 点 。 如 果 兄 弟 结 点 也 满 了 ， 就 将 这 2 个 结 点 分 裂 成 3 个 。 同 
样 ， 当 一 个 结 点 的 关键 字 不 足 时 ， 就 将 它 与 两 个 兄弟 结 点 合并 ， 使 3 个 结 点 减少 为 2 个 。 
其 目的 是 使 结 点 内 维持 较 多 的 关键 字 ， 提 高 结 点 存储 密度 ， 并 提高 检索 效率 。 这 个 思想 还 
可 继续 推广 ， 使 更 多 的 结 点 参与 合并 和 分 裂 ， 但 算法 也 会 更 加 复杂 些 。 

以 上 介绍 的 二 又 排序 树 、AVL 树 、B 树 和 B 树 等 ， 结 点 内 存放 着 完整 的 关键 字 。 若 关 
键 字 位 数 较 多 (或 由 若干 部 分 组 合 而 成 )， 还 可 把 关键 字 按 位 (或 组 成 部 分 ) 分 解 后 分 别 存 
放 到 从 根 到 该 结 点 的 路 径 上 ， 这 可 使 关键 字 中 相同 的 前 绥 部 分 共用 储存 空间 。 这 类 树 称 为 
键 树 。 比 如 ， 帮 图 5.26 所 示 的 树 为 键 树 ， 则 叶子 I 表示 串 “ACFI”， 叶 子 G 表示 串 “ACG” 
等 。 实际 上 图 5.36 所 示 的 哈 夫 曼 编 码 树 就 是 一 种 键 树 ， 如 叶子 c 对 应 编码 “110”， 叶 子 d 
对 应 编码 “1110” 等 。 


8.3.5 空间 树 表 


前 和 面 我 们 讨论 的 二 又 排 序 树 、B 树 等 都 只 能 用 于 单 关 键 字 答 找 。 如 果 要 进行 多 关键 字 
但 找 ， 一 个 方法 是 将 多 关键 字 合 成 为 一 个 关键 字 ， 册 采用 前 述 的 各 种 租 找 方法 。 但 这 样 一 
来 就 不 适合 进行 范围 得 找 了 ; 男 一 个 方法 是 分 别 对 每 个 关键 学 建立 一 个 查找 表 ， 查 找 时 在 
相应 的 表 中 进行 。 但 多 关键 字 碍 找 较 好 的 方法 是 采用 空间 数据 结构 (Spatial Data Structure )， 
因为 每 个 关键 字 相 当 于 多 维 空间 中 的 一 维 。 这 方面 的 应 用 也 很 多 ， 如 地 理 信 息 系 统 、 计 算 
机 图 形 学 等 对 于 物体 位 置 的 碍 找 和 管理 等 。 本 节 简 单 介 绍 这 方面 的 几 个 数据 结构 。 

1. k-d 树 

k-d 树 是 对 二 又 排 序 树 的 改进 ， 它 能 有 效 处 理 多 关键 字 查 找 问 题 。 由 于 二 又 排序 树 的 
每 个 结 点 只 能 根据 一 个 关键 字 产 生 分 文 ， 所 以 对 多 关键 字 问 题 ， 每 层 结 点 交替 地 根据 其 中 
的 一 个 关键 字 产 生 分 支 。 具 体 就 是 ， 如 果 天 键 字 有 Kk 个 ， 则 第 1, 2，…, k, k+1, kt+2，… 层 的 
结 点 分 别 根据 第 1, 2,…, k, 1, 2，… 个 关键 字 产生 分 文 。 一 般 地 ， 设 茶 结 点 当前 层 数 为 i 
则 该 结 点 分 文 时 所 根据 的 关键 字 序 号 为 (1)%k+l。 

例如 ， 对 二 维 空间 的 一 组 数据 点 A(20, 25)、B(10, 10)、C(25, 05)、D(15, 20)、E(29, 15)、 
F(25, 20)， 相 应 的 k-d 树 如 图 8.17 (a) 所 示 。 这 里 每 个 结 点 有 两 个 关键 字 ， 即 该 结 点 的 x， 
y 坐标 。 第 一 个 点 A 即 为 根 第 二 个 点 B 与 根 A 比较 ，A 点 为 第 一 层 ， 按 第 一 个 关键 字 x 
分 文 ， 而 B 的 x 坐标 比 A 小， 所 以 应 插入 到 人 A 的 左 子 树 中 ,但 A 左 子 树 为 空 ， 结 果 了 成 
为 A 的 左 孩 子 ， 类 似 ， 第 三 个 点 C 的 x 坐标 比 A 大 ， 成 为 A 的 右 孩 子 。 第 四 个 点 DD 的 x 
坐标 比 A 小 ， 应 插入 到 A 的 左 子 树 中 ， 此 时 左 子 树 非 空 ， 则 继续 与 左 树 的 根 B 比较 ，B 
点 为 第 二 层 ， 按 第 二 个 关键 字 y 分 文 ， 所 以 D 应 插入 到 B 的 右 子 树 中 ， 结 果 成 为 也 的 右 
骇 子 。 其 他 点 的 分 析 类 似 。 


B(10,10) 


(a) k-d 树 (b) k-d 树 对 应 的 区 域 分 解 


图 8.17 k-d 树 示例 


上 述 过 程 实际 上 就 是 k-d 树 的 插入 和 生成 过 程 。 其 中 寻找 插入 位 置 的 过 程 也 就 是 k-d 
树 的 僵 找 过 程 。 这 些 操作 与 二 又 排序 树 是 类 似 的 ， 只 是 要 交 巷 改变 比较 规则。k-d 树 的 删 
除 过程 也 与 二 又 排序 树 类 似 ， 设 行 删除 的 点 为 N， 则 一 般 方法 是 用 N 的 右 子 树 中 分 文 规则 
与 N 相同 的 最 小 值 结 点 蔡 代 N， 或 者 用 NN 的 左 子 树 中 分 文 规则 与 N 相同 的 最 大 值 结 点 准 
代 N。 但 这 里 最 小 值 或 最 大 值 结 点 就 不 一 定 是 相应 子 树 中 最 左下 或 最 右 下 的 结 点 了 ， 壳 要 
进行 合 找 。 
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对 上 述 空间 数据 点 ， 结 点 的 每 次 分 文 实际 上 相当 于 将 该 点 所 在 的 区 域 分 成 两 部 分 ， 所 
以 数据 点 所 在 的 整个 区 域 就 相当 于 分 别 按 (x,y) 分 割 成 了 硅 干 算 形 ， 见 图 8.17 (b) 所 示 。 
注意 其 中 的 坐标 系 为 左手 系 。 

2. PR 四 分 树 

点 -区 域 四 分 树 (Point-Region Quadtree，PR 四 分 树 ) 是 一 种 严格 四 又 树 ， 其 结 点 要 人 么 
是 叶子 , 要 么 有 四 个 孩子 。 PR 四 分 树 主要 用 于 二 维 区 域 的 分 解 : 设 二 维 区 域 有 若干 数据 点 ， 
现 要 将 该 区 域 划 分 成 若干 小 区 域 ， 使 每 个 小 区 域 中 最 多 只 包含 一 个 数据 点 。 不 妨 设 原 始 区 
域 为 矩形 ， 这 个 要 求 可 以 这 样 完 成 : 首先 将 区 域 一 分 为 四 ， 如 果 其 中 某 个 子 区 域 的 数据 点 
多 于 一 个 ， 继 续 对 该 区 域 一 分 为 四 。 最 后 ， 所 有 子 区 域 要 么 没有 数据 点 ， 要 么 只 含有 一 个 
数据 点 。 这 个 过 程 可 以 很 方便 地 用 一 个 四 又 树 来 表示 。 

以 每 次 四 等 分 为 例 ， 图 8.18 表示 了 一 个 矩形 区 域 分 解 的 结果 和 相应 的 PR 四 分 树 。 其 
中 每 个 分 支 结 点 对 应 一 次 四 分 过 程 ， 这 些 点 上 不 存放 数据 ; 所 有 数据 点 存放 在 叶子 中 (但 
有 些 叶 子 不 含 数据 点 ， 对 应 空 的 子 区 域 )。 注 意 ， 各 个 分 文 结 点 的 四 个 子 树 的 排列 顺序 要 相 
同 〈 图 中 是 从 左上 角 开 始 逆 时 针 方 癌 排 列 的 )。 


(a) PR 四 分 区 域 分 解 (b) PR 四 分 树 


图 8.18 PR 四 分 树 示 例 


但 找 时 从 根 结 点 开始 ， 不 断 进 入 竺 得 点 所 在 的 子 区域 ， 直 到 叶子 区 域 ， 然 后 检查 该 叶 
子 的 内 容 是 否 是 所 求 的 数据 点 。 插 入 数据 点 x 时， 先进 行伍 找 ， 和 直到 儿 个 叶子 ， 如 果 该 叶 
子 不 含 数据 点 ， 斌 将 xX 插入 到 该 叶子 ， 如 果 该 叶子 已 含 数据 点 X， 则 报告 数据 点 重复 ， 合 
则 将 该 叶子 区 域 一 分 为 四 ， 最 后 将 x 插入 到 其 中 一 个 子 区域 。 删 除 时 也 是 先进 行 租 找 ， 下 
到 菏 个 叶子 ， 如 果 该 叶子 加 是 竺 删 点 ， 则 将 其 内 容 清 空 。 但 这 时 删除 操作 并 不 马上 结束 ， 


而 是 检查 该 叶子 的 三 个 兄弟 结 点 ， 如 果 它 们 也 为 空 或 只 有 一 个 数据 点 ， 则 将 这 四 个 小 区 域 
合并 为 一 个 大 区 域 ， 它 对 应 一 个 新 的 叶子 ， 若 该 叶子 和 它 的 兄弟 结 点 中 又 都 为 空 或 只 含 一 


个 数据 点 ， 则 继续 合并 下 去 。 

显然 ， 对 于 三 维 空间 ， 与 PR 四 分 树 对 应 的 是 PR 八 分 树 〈Point-Region Octree)， 即 每 
次 将 区 域 分 成 八 个 小 区 域 ， 一 般 也 采用 八 等 分 的 形式 。 

另外 ， 如 果 在 每 次 区 域 分 解 时 以 数据 点 为 中 心 将 区 域 一 分 为 四 ， 则 对 应 的 四 又 树 称 为 
点 四 义 树 (Point Quadtree)， 如 几 8.19 所 示 。 在 这 种 四 又 树 中 ， 分 文 结 点 和 叶 结 点 都 可 能 
存放 区 域 的 数据 点 信息 。 

还 可 将 k-d 树 和 PR 四 分 树 结合 起 来 ， 交 蔡 地 根据 坐标 分 量 将 区 域 一 分 为 二 ， 对 应 的 


二 又 树 称 为 二 分 树 〈Bintree)， 其 中 每 个 分 文 结 点 对 应 一 次 二 分 过 程 ， 如 网 8.20 所 示 。 
OA 
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oe 
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(a) 点 四 分 区 域 分 解 (b) 点 四 又 树 


8.19 ”点 四 叉 树 示例 


(a) 二 分 区 域 分 解 (b) 二 分 树 
图 8.20 二 分 树 示 例 
与 PR 四 分 树 类 似 ， 二 分 树 的 分 文 结 点 不 存放 数据 ， 所 有 数据 点 部 存 放 在 叶子 中 (但 


有 些 叶 子 不 含 数据 点 ， 对 应 空 的 子 区 域 )。 因 为 每 次 分 解 出 的 小 区 域 数 少 , 需要 的 分 解 次 数 
多 ， 所 以 二 分 树 的 高 度 一 般 比 PR 四 分 树 大 。 不 难 理解 ， 二 分 树 就 是 二 分 区 域 分 解 的 判 
定 树 。 


4、 散 列表 


在 前 面 介绍 的 静态 查找 表 和 用 于 动态 查找 的 树 表 中 ， 结 点 的 存储 位 置 和 结 点 的 关键 字 
之 间 不 存在 确定 的 关系 ， 要 查找 某 个 结 点 需要 进行 一 系列 的 关键 字 比 较 。 这 类 查找 方法 奸 
立 在 “比较 ”的 基础 上， 每 次 比较 后 可 缩小 查找 范围 ， 查 找 效率 依赖 于 查找 过 程 中 进行 比 
较 的 次 数 。 是 否 可 以 不 作 比较 就 可 以 得 到 记录 的 存储 地 址 ， 从 而 找到 所 要 的 结 点 呢 ? 回答 
是 肯定 的 ， 这 就 是 散 列 技术 。 


8.4.1 ” 散 列 表 的 基本 概念 


散 列 (Hashing) 既是 一 种 储存 方式 ， 又 是 一 种 得 找 方法 ， 其 基本 思想 是 根据 键 什 直接 
访问 表 。 一 般 过 程 如 下 : 以 结 点 的 关键 子 key 为 日 变量 ， 通 过 一 个 确定 的 函数 关系 f， 计 
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算出 相应 的 函数 值 f(key)， 把 这 个 值 解释 为 结 点 的 储存 地 址 ， 将 结 点 存 入 该 位 置 。 盘 找 时 
根据 要 俘 找 的 关键 字 用 同样 的 函数 计算 地 址 ， 然 后 到 相应 的 单元 里 去 取 值 。 因 此 ， 黎 列 法 
义 称 关 键 字 -地 址 转换 法 。 上 述 函 数 f 称 为 散 列 函数 ， 函 数值 f{(K) 称 为 散 列 地 址 ， 根 据 关 键 
字 将 记录 映射 到 表 中 的 过 程 称 为 散 列 ， 按 黎 列 方式 构造 的 储存 结构 称 为 散 列 表 (Hash 
Table ) 。 

下 面 看 一 个 简单 的 例子 。 

例 8.1 已 知 一 个 含有 80 个 络 点 的 做 列表 ， 其 关键 宁都 是 两 位 十 进 制 的 数字 〈 关 键 字 
互 不 相同 )， 则 可 将 关键 学 为 1 的 结 点 存在 数组 HT[100] 的 第 1 号 元 素 中 ， 即 取 艇 列 函 数 为 : 

H (key)=key 

在 理想 情况 下 ， 敌 列 函数 是 个 一 一 对 应 的 单调 函数 ， 即 不 同 的 键 值 对 应 不 同 的 黎 列 地 
址 ， 比 如 上 例 。 但 在 实际 应 用 中 ， 敌 列 函 数 通 沼 是 个 多 对 一 的 函数 (主要 原因 是 关键 字 取 
值 集合 大 ， 地 址 集合 空间 小 ， 前 者 到 后 者 是 一 个 压缩 映像 )， 于 是 ， 经 间 出 现 不 同 的 键 值 对 
应 相同 的 散 列 地 址 。 这 种 现象 称 为 冲突 (Collision )， 发 生 冲 突 的 关键 字 称 为 同义词 
(CSynonym)。 极 端 情况 是 所 有 关键 字 都 是 同义词 ， 这 时 向 列表 就 完全 失去 了 有 意义 。 

对 一 些 特 定 情 况 , 有 可 能 设计 出 完全 不 发 生 冲 突 的 敌 列 函数 , 称 之 为 完美 散 列 (Perfect 
Hashing )， 但 代价 会 很 咒 ， 除 非 确 有 必要 ， 如 记录 集 不 变 但 要 大 量 使 用 的 情况 ， 一 个 典型 
例子 是 对 程序 语言 中 的 保留 字 进 行 佑 列 。 一 般 而 言 ， 神 突 是 不 可 避免 的 ， 只 能 尽量 减少 剖 
突 。 一 旦 发 生 了 冲突 ， 就 必须 采取 适当 的 方法 进行 处 理 〈( 将 冲突 项 放 到 合适 位 置 )。 因 此 ， 
采用 散 列 技术 时 需要 解决 的 两 个 主要 问题 是 : 散 列 函数 的 构造 和 冲突 的 处 理 。 

例 8.2 ”已 知 散 列表 的 关键 字 集 合 为 : 

S={do, for,while,continue,break,if,else,dgoto} 

注意 到 关键 字 的 首 字 母 不 同 ， 可 将 每 个 结 点 存储 到 由 26 个 单元 组 成 的 数组 中 ， 结 点 
在 数组 中 的 位 置 ， 即 数组 下 标 取 为 关键 字 的 首 字符 在 26 个 英文 学 母 表 {a, b,…, z} 中 的 序 
号 《这 里 取 序 号 从 0 开始 ， 序 号 范围 是 0 一 23)， 即 取 散 列 函 数 为 : 

H(key)=keyl0]— a’ 


每 个 数组 单元 要 存放 一 个 字符 串 ， 故 整个 数组 可 取 为 char HT[26][9]。 

如 果 再 增加 2 个 关键 子 fopen、fprintf， 则 在 上 述 黎 列 函 数 下 必定 出 现 冲 突 ， 因 为 有 3 
个 关键 和 学 的 首 字 从 相同 ， 都 为 “f”， 于 是 获 列 地 址 也 相同 。 这 时 可 取 敌 列 函 数 H(key) 为 key 
中 首尾 字母 在 字母 表 中 序 写 的 平均 值 ， 由 于 尾 字 母 不 同 ， 散 列 地 址 就 不 再 冲突 了 。 

根据 散 列 表 的 基本 原理 可 知 ， 它 不 适合 按键 值 的 大 小 顺序 或 访问 的 频率 顺序 来 存放 或 
但 找 结 点 ; 不 适合 范围 检索 ， 也 不 适合 碍 找 最 大 或 最 小 键 值 的 结 点 ， 只 适合 检索 指定 键 什 

报 列 表 的 多 辑 结 构 是 集合 。 按 组 织 形 式 的 不 同 ， 通 利 有 两 类 散 列 表 : 闭 做 列表 和 开 散 
列表 。 从 形式 上 看 ， 它 们 相当 于 一 般 数 据 结构 第 用 的 顺序 存储 方式 和 链 式 存储 方式 ， 但 我 
们 并 不 称 它 们 为 “顺序 散 列 表 ” 和 “ 链 式 散 列 表 ”， 主 要 是 含义 和 结果 不 同 。 这 里 结 点 的 地 
址 不 反映 逻辑 关系 ， 但 与 其 内 容 或 关键 学 有 关 ， 还 与 冲突 处 理 的 方法 有 关 。 男 外 ， 散 列表 
中 一 般 不 允许 有 和 键 值 相同 的 结 点 。 

散 列 表 的 存储 空间 一 般 是 个 一 维 数组 ， 散 列 地 址 是 数组 的 下 标 。 在 不 全 于 混 消 时 ， 我 


们 也 将 这 个 一 维 数组 空间 简称 为 散 列 表 。 数 组 空间 的 大 小 称 为 表 的 容量 或 表 长 。 设 散 列 表 
的 长 度 为 m， 填 入 表 中 的 结 点 数 是 n， 则 称 a=n/m 为 散 列 表 的 装填 因子 (Load Factor)。 如 
对 上 面 例 8.1， 装 填 因 子 为 80/100=0.8。 


8.4.2 ” 散 列 函数 的 构造 方法 


散 列 函数 的 种 类 很 多 ， 一 般 构 造 或 选取 散 列 函数 的 基本 原则 是 简单 和 均 义 。 前 者 指 散 
列 函 数 的 计算 简单 快捷 , 后 者 指 散 列 函 数 能 把 记录 以 相同 的 概率 分 布 到 散 列 表 的 任何 位 置 ， 
以 尽量 减少 冲突 。 如 果 关 键 字 本 喘 的 分 布 很 不 均匀 ， 比 如 某 些 范围 内 比较 密集 ， 则 对 敌 列 
函数 的 均匀 性 要 求 就 更 加 突出 。 为 了 尽量 减少 冲突 ， 一 般 要 充分 利用 关键 字 的 所 有 组 成 部 
分 ， 即 通过 不 同 部 分 获得 不 同 地 址 (相当 于 将 单 变 量 函 数 转 化 成 了 “多 变量 ” 隐 数 )。 

为 简便 起 见 ， 以 下 假定 关键 字 是 无 符号 的 整 型 〈 即 目 然 数 ， 其 他 类 型 通常 可 转换 为 该 
类 型 )， 且 散 列 地 址 也 是 无 符号 的 整 型 。 

1. 直接 定 址 法 (Immediately Allocating Method ) 

将 散 列 函数 直接 取 为 关键 字 的 荣 种 线性 函数 : 


H (key) =aXkey 十 b 


若 a 为 整数 且 不 为 0， 则 这 类 散 列 函 数 是 一 一 对 应 的 ， 不 会 产生 冲突 ， 如 例 8.1。 但 车 
关键 字 取 值 范围 较 大 ， 则 所 需 的 地 址 范围 ， 也 即 存储 空间 也 较 大 ， 所 以 实际 使 用 较 少 。 

2. 数字 选择 法 (Digit Extraction Method ) 

数字 选择 法 也 称 数 字 分 析 法 (Digit Analysis Method)。 若 事先 知道 关键 字 每 一 位 上 数 
字 的 分 布 规律 ， 且 关键 字 的 位 数 比 散 列 地 址 的 位 数 多 ， 则 可 取 数 字 分 布 比较 均匀 的 用 干 位 
或 其 组 合作 为 敌 列 地 址 。 

例如 ， 有 一 组 由 8 位 数学 组 成 的 关键 学 ， 如 图 8.21 左边 一 列 所 示 。 


天 键 字 散 列 地 址 1(0 一 999) | ” 散 列 地 址 2(0 一 99) 


99023481 05 
99043512 57 
99077235 07 
99133858 96 
99107673 79 


99117064 


图 8.21 关键 字 与 散 列 地 址 示例 


分 析 这 些 关 键 字 会 发 现 ， 前 两 位 都 是 99， 当 然 不 均匀 ; 第 三 、 五 位 也 分 别 只 取 0、1 
和 3、7 两 个 值 ， 故 这 些 位 都 不 可 取 。 第 四 、 六 、 七 、 八 位 数字 分 布 较为 均匀 ， 因 此 ， 可 根 
据 散 列表 的 长 度 取 其 中 几 位 或 它们 的 组 合作 为 敌 列 地 址 。 比 如 ， 奎 表 长 为 1 000《〈 即 地 址 
为 0 一 999)， 则 可 取 其 中 三 位 〈 如 四 、 六 、 七 位 ) 数字 作为 散 列 地 址 ， 帮 表 长 为 100( 即 地 
址 为 0 一 99)， 则 可 取 其 中 两 位 或 两 位 的 组 合 〈 如 四 、 六 与 七 、 八 位 之 和 并 人 铭 去 进位 ) 作为 
散 列 地 址 等 ， 其 结果 见 图 8.17 中 的 散 列 地 址 1 和 散 列 地 址 2。 
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3. 平方 取 中 法 (Mid-square Method) 

各 关键 字 各 位 的 数字 分 布 未 知 ， 或 不 均 义 ， 可 采用 平方 取 中 法 : 先 对 关键 字 求 平方 以 
扩大 差别 ， 然 后 册 取 中 间 的 几 位 或 其 组 合作 散 列 地 址 。 因 为 乘积 的 中 间 几 位 数 和 乘 数 的 每 
一 位 都 相关 ， 故 由 此 产生 的 散 列 地 址 也 比较 随机 (均匀 )， 所 取 位 数 由 散 列 表 的 表 长 决定 。 

例如 ， 对 关键 子 组 {1101, 0011, 0101, 0111, 1001}， 其 各 位 分 布 很 不 均匀 ， 平 方 后 得 : 


TZ1Z201 00001Z1 .00L0201 .00123Z21 ;10020011 


在 表 长 为 1000， 则 可 取 中 间 三 位 作为 做 列 地 址 : 


{122,001,102,123,020} 


4. 折 锥 法 (Folding Method) 

硅 关 键 字 位 数 较 多 ， 也 可 将 关键 学 分 割 成 位 数 相 同 的 硅 干 段 ( 最 后 一 段 的 位 数 可 以 不 
同 ), 段 的 长 度 取决 于 敌 列 表 的 地 址 位 数 , 然后 将 各 段 的 合 加 和 ( 舍 去 进位 ) 作为 散 列 地 址 。 
折 著 法 又 分 移 位 车 加 (Shift Folding) 和 边界 登 加 (Boundary Folding) 两 种 。 移 位 登 加 是 
将 各 段 的 最 低位 对 齐 ， 然 后 相 加 ; 边界 印加 则 是 两 个 相 令 的 段 沿 边界 来 回 折 羞 ， 然 后 对 齐 
相 加 。 移 位 车 加 时 各 有 段 的 先后 顺序 没有 作用 ， 从 这 点 上 看 不 如 边界 车 加 。 

将 关键 字数 字 分 段 时 有 从 低位 开始 ， 则 可 用 取 模 运算 取出 每 段 的 结果 ， 如 K%100 就 
得 到 十 位 和 个 位 ，(K/100)%100 就 得 到 千 位 和 百 位 等 。 例 如 对 关键 学 62528315168， 设 表 
长 为 1000， 则 取 三 位 为 一 段 进 行营 加 ， 可 有 如 下 结果 : 


移 位 营 加 边界 登 加 
062 - 260 
528 L. 528 -， 
315 - 513. 
十 ) 168 十 儿 168 
[1] 073 [1] 469 
H(key)=073 H(key)=469 


折 县 法 也 可 用 于 字符 串 , 即将 各 字符 看 成 ASCII 码 。 特别 地 ， 如 果 每 段 只 取 一 个 字符 ， 
结果 就 是 将 各 字符 的 ASCII 人 码 加 起 来 ( 舍 去 进位 )。 

5. 除 余 法 (Division Remainder Method，Modulo-division Method) 

选择 一 个 适当 的 正 整数 P， 用 了 去除 关键 学 ， 取 所 得 余数 作为 敌 列 地 址 ， 即 : 

H(key)=key%P 

该 方法 的 关键 是 选取 适当 的 了 P。 如 果 P 为 关键 学 的 基数 或 其 蜗 次 ， 则 等 于 取 关 键 字 的 
低位 数字 作 地 址 , 与 高 位 数学 无关， 显然 地 址 不 均匀 ， 这 时 低位 数字 相同 的 关键 学 都 冲突 。 
例如 ， 对 关键 字 12、512、312、1012 等 ， 唇 选 P=100， 则 它们 的 地 址 都 是 12， 冲 突 。 

如 果 P 为 个 数 ， 则 奇数 的 关键 字 对 应 到 奇数 地 址 ， 偶 数 的 关键 字 对 应 到 偶数 地 址 ， 显 
然 地 址 不 均匀 ; 特别 地 ， 大 关键 字 集 合 中 奇 、 偶 数 个 数 不 等 ， 则 较 多 的 一 方 更 易 神 突 。 如 
果 P 为 奇数 但 不 是 素数 ， 则 当 关 键 字 与 P 有 公 因 了 于 时 对 应 的 地 址 也 有 该 公 因 了 于 ， 即 地 址 为 
该 公 因 子 的 倍数 ， 也 不 均匀 。 

一 般 P 取 小 于 或 等 于 散 列 表 长 度 mm 的 茶 个 最 大 素数 。 如 m=13 一 16 时 , 可 取 P=13 等 。 


特别 地 ， 如 果 敌 列表 长 度 m 本 和 喘 就 为 素数 ， 则 取 P=m。 各 mm 较 大 ， 则 了 也 可 取 合 数 ， 但 
一 般 要 求 其 因子 为 较 大 的 素数 。 如 P=29x31=899 等 ， 这 可 避免 找 大 素数 的 困难 。 

注意 ， 铬 P<m， 则 散 列 地 址 0 一 P-1 后 的 单元 不 是 “空闲 区 ” 它们 在 以 后 的 冲突 处 理 
中 会 用 到 ( 闭 散 列表 时 )。 

除 余 法 计算 简单 , 不 需要 知道 天 键 字 各 位 的 分 布 规律 , 也 不 必 关 心 关 键 字 位 数 的 多 少 ， 
并 且 在 许多 情况 下 效果 较 好 ， 因 此 ， 除 余 法 是 一 种 最 常用 的 敌 列 函数 构造 方法 。 

6. 基数 转换 法 (Radix Transformation Method ) 

先 把 关键 字 看 成 是 男 一 个 数 制 上 的 数 ， 再 把 它 转 换 成 原来 数 制 上 的 数 ， 取 其 中 的 若干 
位 作为 获 列 地 址 。 一般 取 大 于 原来 基数 的 数 作 为 转换 的 基数 (可 扩大 差别 )， 并 且 两 个 基数 
要 互 素 。 例 如 ， 给 定 一 个 十 进 制 数 的 关键 字 (12057)i。， 我 们 先 把 它 看 成 是 以 13 为 基数 的 
十 三 进 制 数 (12057)13， 再 把 它 转 换 为 十 进 制 数 ; 


(12057)13=1X13“ 十 2X13” 十 0 X13 十 5X13 十 7=33027 


假设 散 列 表 长 度 为 1000， 则 可 取 其 中 三 位 ， 如 低 三 位 027 作为 散 列 地 址 。 
7. 随机 数 法 CRandom Number Method ) 
选择 一 个 随机 函数 ， 取 关键 字 的 随机 函数 值 作 散 列 地 址 ， 即 : 


Hl(key)=random (key) 


其 中 ，random 为 随机 函数 。 通 音 ， 当 关键 字 长 度 不 等 时 这 种 方法 比较 恰当 。 

注意 ， 随 机 函数 应 为 伪 随 机 的 ， 即 对 不 同 关 键 字 得 到 随机 结果 ， 但 对 同一 个 关键 字 ， 
每 次 运行 的 结果 要 相同 ， 否 则 建 表 和 以 后 的 查找 过 程 不 能 保证 相同 的 散 列 地 址 。 

以 上 方法 还 可 根据 情况 组 合 使 用 ， 比 如 除 余 法 ， 在 关键 字 连 续 ， 则 散 列 地 址 也 连续 ， 
此 时 均匀 性 不 好 ， 可 把 原 关 键 字 平方 、 折 苇 或 基数 转换 后 再 用 除 余 法 。 

广义 地 讲 ， 各 种 散 列 函数 都 是 在 生成 菜 个 与 关键 字 有 关 的 “随机 数 ”， 有 人 用 “ 轮 盘 
赌 ” 的 统计 分 析 方 法 进行 过 模拟 分 析 ， 结 论 是 平方 取 中 法 最 接近 于 “随机 化 ”。 进 一 步 ， 
也 可 以 直接 借用 一 些 随 机 函数 的 生成 方法 或 思想 来 设计 散 列 函数 。 


8.4.3 处理 冲突 的 方法 


处 理 冲 突 的 方法 基本 上 可 以 分 为 两 大 类 : 开放 地 址 法 和 链 地 址 法 。 

1. 开放 地 址 法 (Open Addressing) 

这 种 冲突 处 理 方法 的 基本 思想 是 : 当 发 生 冲 突 时 ， 使 用 菏 种 方法 在 敌 列 表 中 形成 一 个 
探查 序列 ， 沿 此 序列 逐个 单元 地 得 找 ， 直 到 找到 给 定 的 关键 字 ， 或 者 人 肆 到 一 个 开放 的 地 址 
( 即 空 单元 ) 为 止 "。 插 入 时 碰 到 开放 地 址 ， 则 将 待 插 入 的 新 结 点 存放 在 该 地 址 单元 中 ， 查 
找 时 全 到 开放 地 址 ， 则 表明 表 中 没有 待人 租 的 关键 字 。 之 所 以 将 空 单元 称 作 开放 地 址 ， 是 因 
为 它 对 所 有 关键 字 都 “开放 ” 既 可 存放 同义词 ， 也 可 存放 非 同 义 词 ， 取 决 于 谁 先 占用 它 。 

显然 ， 用 开放 地 址 法 建立 散 列 表 ， 建 表 前 必须 将 表 空 间 的 所 有 单元 置 空 〈( 即 设置 空 标 
志 )。 开 放 地 址 法 组 织 的 敌 列 表 叉 称 为 闭 散 列表 , 它 不 论 记 录 是 人 耕 冲 突 都 存储 在 同一 个 数组 


G 对 初始 散 列 地 址 的 检查 实际 也 是 一 次 “探查 ”， 在 谈 到 “总 探查 次 数 ” 时 ， 不 仅 指 冲 突 后 的 探查 ， 
还 应 包含 初始 地 址 检查 的 这 一 次 《参见 习题 8.7)。 
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空间 月 ， 也 有 散 列 表 空 间 是 “封闭 ”之 意 。 
财 散 列 表 的 表 空 间 必 须 比 结 点 的 集合 大 ， 或 至 少 相 等 ， 即 逆 填 因子 ga<1， 此 时 要 浪费 

一 定 的 空间 ， 但 换取 的 是 查找 效率 。 使 用 时 ， 常 在 区 间 [0.65 0.9] 上 取 a 的 适当 值 。 

根据 形成 探 得 序 列 的 方法 不 同 ， 解 决 神 突 的 方法 也 不 相同 。 下 面 介 绍 几 种 第 用 的 探 香 
方法 ， 并 假设 敌 列 表 的 长 上 度 为 m， 结 点 个 数 为 n， 敌 列 地 址 d=H(key)。 

(1) 线性 探查 法 (Linear Probing) 

线性 探查 法 的 基本 思想 是 : 将 散 列 表 看 成 是 一 个 环形 表 。 大 地 址 为 d 的 单元 发 生 冲 突 ， 
则 依次 探查 d 的 后 继 单元 d+1, d+2,…, m1, 0, 1,，…, d~1， 即 探查 地 址 为 ”: 

d=(dt)%m 1<i<m-l 

探查 时 直到 找到 一 个 空 单元 或 关键 字 为 key 的 单元 为 止 。 当 然 ， 若 一 直 探 查 到 序列 的 
最 后 一 个 地 址 d-1 都 不 能 找到 一 个 空 单元 或 关键 字 为 key 的 单元 ， 则 无 论 是 查找 还 是 插入 
都 意味 看 失败 (此 时 表 满 )。 

例 8.3 己 知 一 组 关键 学 为 {26, 15, 12, 23, 7, 64, 18, 28, 51, 29, 23}， 用 除 余 法 构造 散 列 
国 数 ， 用 线性 探 得 法 解决 冲突 ， 试 构造 这 组 关键 字 的 侣 列表 。 

解 : 这 里 n=11， 疝 需 决 定 散 列 表 长 度 m 和 散 列 函数 的 除数 P。 在 闭 散 列 表 中 一 般 令 装 
填 因 子 a<1 以 减少 冲突 ， 现 初步 取 or=0.75， 则 散 列表 长 度 mi nc 上 14.6 上 15$， 即 散 列表 
为 HT[15]。 此 时 实际 装填 因子 为 a=11/15=0.733， 与 预 设 值 差 别 不 大 。 用 除 余 法 构造 散 列 
图 数 ， 因 m=15， 故 选 P=13， 即 散 列 函数 为 H(key)=key%13。 

由 散 列 函数 得 到 各 关键 字 的 散 列 地 址 ， 见 图 8.22 (a)。 

插入 时 ， 由 散 列 地 址 找到 相应 的 存储 单元 ， 奉 该 地 址 是 开放 的 ， 则 插入 新 结 点 ; 否则 
线性 探查 下 一 个 地 址 。 第 一 次 插入 的 是 26， 其 散 列 地 址 d=0， 是 一 个 开放 地 址 ， 故 26 插 
入 到 HT[0]。 类 似 ，15、12、23 和 7 依次 分 别 插入 到 HT[2]、HT[12]、HT[10] 和 HT[7]。 

当 插 入 64 时 ， 其 若 列 地 址 d=12， 而 HT[12] 已 被 关键 学 12 占用 ， 冲 突 ， 则 探 合 下 一 
个 地 址 13, 为 开放 地 址 , 于 是 将 它 插 入 HT[13] 中 。 接 下 来 ,18 和 直接 插入 到 HT[5], 28、51、 
29 和 25 均 发 生地 址 冲突 ， 分别 探 查 1、2、1 和 4 次 后 ， 插 入 到 HT[3]、HT[14]、HT[4] 和 
HT[1] 中 。 由 此 构造 的 散 列 表 见 图 8.22 (b)， 其 中 的 虚线 表示 最 后 插入 25 时 的 探查 过 程 。 


关键 字 key | 26 | 15 | 12| 23| 7 | 64 | 18| 28 | 51| 29 
Ga) 散 列 地 址 keyx13| 0 | 2 | 12| 1017 1121 5|2112|131|12 


一 TT 
- - 

一 _- 
~- = 


rc #7 4 
4 za 3 总 9 10 11 12 13 14 


Cb) 散 列 表 pe 


人 -查找 成 功 时 比较 次 数 | 1 | 5 | 1| 2 | 2 | 1 11| | |1| |1|213 
”查找 不 成 功 时 比较 次 数 | 7 | 6 | 5 | 4 | 3 | 2 | 1| 2 | 11 11211|l1| 


8.22 ”线性 探查 法 构造 散 列 表示 意图 


在 上 例 中 ，H(28)=2，H(29)=3， 即 28 和 29 不 是 同义词 ， 但 由 于 处 理 28 和 同义词 15 


Q 一 般 形式 为 d=[d+(ait+b)]%m， 当 i=0 时 应 为 初始 地 址 4d， 所 以 b=0; 为 了 探查 到 表 的 所 有 地 址 ，a 
应 和 m 互 素 ， 特 别 地 取 a=1。 


的 冲突 时 ，28 抢先 占用 了 HT[3], 这 就 使 得 插入 29 时 ， 这 两 个 本 来 不 应 该 发 生 冲 突 的 非 同 
义 词 之 间 也 会 发 生 冲突 。 

一 般 地 ， 用 线性 探查 法 解决 冲突 时 ， 当 表 中 1 Ii+ …, itk 位 置 上 已 有 结 点 时 ， 散 列 地 
址 为 ,1+1,…, i+tk, i+k+l 的 结 点 都 将 试图 插入 在 位 置 itk+l 上 。 由 于 散 列 地 址 不 同 的 结 点 ， 
都 争夺 同一 个 后 继 散 列 地 址 ， 于 是 在 该 位 置 上 插入 的 概率 就 比 其 他 空位 置 高 得 多 。 这 个 过 
程 发 展 下 去 ， 记 录 就 有 一 种 聚集 到 一 起 的 倾向 ， 称 之 为 堆积 (clustering)。 

其 结果 是 某 些 位 置 附近 “堆积 ”了 大 量 结 点 ， 造 成 不 是 同义词 的 结 点 也 处 在 同一 个 探 
查 序列 之 中 ， 从 而 增加 了 探查 序列 的 长 度 。 若 干 小 堆积 还 可 能 汇集 成 大 堆积 ， 情 况 会 变 得 
更 差 。 显 然 ， 堆 积 越 严重 ， 以 后 的 查找 就 越 来 越 退 化 成 顺序 查找 。 

若 散 列 函数 选择 不 当 ， 或 装填 因子 过 大 ， 都 可 能 使 堆积 的 机 会 增加 。 

为 了 减少 堆积 的 机 会 ， 就 不 能 像 线 性 探查 法 那样 逐个 探查 连续 的 地 址 序列 ， 而 应 该 使 
探查 序列 跳跃 式 地 散 列 在 整个 散 列 表 中 。 下 面 的 几 种 冲突 处 理 方法 ， 与 线性 探查 法 相 比 ， 
可 大 大 减少 堆积 的 可 能 性 。 

(2) 二 次 探查 法 (Quadratic Probing ) 

发 生 冲突 时 ， 探 查 序列 依次 是 dt1” d+2”,，…， 即 探测 地 址 为 ”: 

d=(d+i’ )%m lx<ixm-l 

通常 用 它 的 一 种 改进 形式 ， 探查 时 双向 交替 进行 ， 探 查 序列 依次 是 d+1”, d-1”, d+2”, 
d-2”,…， 即 发 生 冲 突 时 ， 将 同义词 来 回 散 列 在 地 址 d 的 两 端 ， 探 测 地 址 为 : 

dzi_1=(d+i’)%m 

d=(d—i)%m; if(dyi=<0) dy=dzyitm:; lxix (m-1)/2 

二 次 探查 时 ， 步 伐 按 平 方 加 大 ， 可 有 效 减少 堆积 的 可 能 性 ， 但 不 容易 探查 到 整个 散 列 
表 空 间 。 只 有 当 表 长 m 为 多 +3 的 素数 时 ， 才 能 探查 到 整个 表 空 间 〈 对 改进 形式 而 言 )， 这 
里 j 为 某 一 正 整 数 。 

可 以 证 明 ， 在 表 长 为 素数 且 装 填 因 子 不 超过 0.5 时， 冲突 后 最 多 再 探查 1 次 即 可 。 

(3) 随机 探查 法 (Random Probing ) 

采用 随机 探查 法 解决 冲突 时 ， 探 查 地 址 为 : 

di=(d+R;)% m 1<i<m-] 

其 中 Ri 为 某 个 随机 数 。 与 构造 散 列 函数 的 随机 数 法 类 似 ，Ri 也 不 能 真正 “随机 ”选取 ， 
否则 建 表 和 以 后 的 查找 过 程 不 能 保证 相同 的 探查 序列 。 通常 取 Ri 为 1 2,，…, m-1 的 一 个 随 
机 排列 中 对 应 的 数 ， 并 在 建 表 和 查找 时 按 相同 的 排列 进行 探查 。 

二 次 探查 和 随机 探查 可 以 使 非 同 义 词 的 探查 序列 不 同 〈 但 可 能 有 交叉 )， 但 同义词 的 
探查 序列 是 相同 的 ”。 为 使 同义词 的 探查 序列 也 不 相同 ， 探 查 序列 就 应 由 原 关 键 字 来 决定 。 


@ 一 般 形式 为 4=[d+(ai+bi+tcj]%m, 当 i=0 时 应 为 初始 地 址 d, 所 以 c=0; 能 否 探查 到 表 的 所 有 地 址 ， 
主要 取决 于 二 次 项 az， 简 单 地 取 a=1，b=0 (但 此 时 并 不 一 定 能 探查 到 所 有 位 置 )。 

@ 同义词 因 探 查 序列 相同 而 引起 的 聚集 称 为 二 次 聚集 或 次 聚集 (Secondary Clustering)， 前 述 线性 探查 
中 同义词 、 非 同义词 的 探查 序列 重 登 而 引起 的 聚集 称 为 一 次 聚集 或 主 聚 集 (Primary Clustering)。 二 次 聚 
集 时 结 点 分 散在 表 中 各 处 ， 一 次 聚集 时 结 点 连续 成 片 〈 探 查 步 长 为 1 时 )。 但 不 同文 献 有 不 同 解释 ， 如 二 
次 聚集 指 处 理 同 义 词 冲突 时 出 现 非 同 义 词 冲突 ， 或 小 聚集 连 成 大 聚集 等 。 
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(4) 多 散 列 函 数 和 双 散 列 函数 探 碍 法 

使 用 多 个 散 列 函数 ， 大 前 一 个 做 列 地 址 冲突 ， 融 使 用 下 一 个 做 列 地 址 ， 即 探 租 地 址 为 : 

di=Hi(key) 1=], 2, *…, k 

Hi 为 不 同 的 敌 列 函数 。 这 种 方法 不 易 产 生 堆 积 现 象 ， 但 计算 量 大 。 

一 种 改进 方法 是 只 使 用 两 个 散 列 函数 H 和 H2, 其 中 H 和 表面 的 互 一 样 。 铝 Hi(key)=d 
发 生 冲 突 ， 则 计算 Hz(key)， 用 来 对 敌 列 地 址 进行 补偿 。 探 查 地 址 为 : 


di=(dtHiH2(key))»%m lx<i<m-—l1 
显然 HH 要 永 不 为 0( 否 则 原 地 死 循环 探查 )。 定 义 Hz(key) 的 方法 较 多 ,但 必须 使 Hz(key) 


的 值 和 m 互 素 ( 旦 小 于 m), 才能 使 发 生 冲突 的 同义词 地 址 均匀 地 分 布 在 整个 表 中 ; 否则 ， 
探查 地 址 可 能 呈 周 期 性 变化 而 陷入 探查 死 循环 。 

名 m 为 素数 ， 则 Hz(key) 取 1 到 m-l 之 间 的 任何 数 均 与 m 互 素 。 如 果 HH 用 除 余 法 ， 
则 除数 P 不 能 取 m-1 ( 它 为 偶数 ， 不 好 )， 一 般 取 Ho(key)=key%(m-2)+1。 

大 m 是 2 的 方 知 ， 则 Ho(key) 可 取 1 到 mr-l 之 间 的 任何 奇数 。 

若 m 为 其 他 情况 ， 且 Hi(key)=key%P (P 为 m 以 内 的 最 大 素数 )， 则 可 取 
Hz(key)~key%q+1(q 是 小 于 P 的 最 大 素数 )。 

易 见 ， 线 性 探 三 和 二 次 探 便 可 看 成 特殊 的 双 敌 列 探查 : 取 Hz(key)=1， 就 是 线性 探 僵 ; 
取 Hz(key)= 土 !， 则 为 二 次 探查 。 特 别 地 ， 如 果 Ho(key) 取 为 和 m 互 素 的 常数 ， 则 相当 于 线 
性 探查 的 一 种 简单 改进 : 不 是 依次 探查 相 邻 的 单元 ， 而 是 间隔 地 进行 。 

2. 拉链 法 (Separate Chaining ) 

拉链 法 解决 冲突 的 做 法 是 ， 将 所 有 关键 字 为 同义词 的 结 点 链接 在 同一 个 单 链表 中 。 厦 
选 定 的 散 列 函数 的 值 域 为 0 到 mm-1, 则 可 将 散 列 表 定 义 为 一 个 由 m 个头 指针 组 成 的 指针 数 
组 HP[m]， 凡 是 散 列 地 址 为 i 的 结 点 ， 均 插入 到 以 HP 为 头 指针 的 单 链表 中 。 拉 链 法 组 织 
的 散 列 表 又 称 为 开 散 列表 ， 它 将 神 突 记 录 存 储 在 表 外 ， 也 有 散 列 表 空 间 可 问 外 扩展 之 意 。 

注意 ， 对 开 散 列表 ， 装 填 因 子 a=n/m 表示 的 是 所 有 同义词 单 链 表 的 平均 长 度 ， 显 然 ， 
它 可 以 小 于 1， 也 可 以 等 于 1 或 大 于 1。 而 在 闭 散 列表 中 ， 一 定 是 ws1。 

对 每 个 同义词 链表 ， 在 建 表 时 需要 搜索 完 才 知道 其 中 是 否 有 键 值 重复 的 记录 ， 于 是 就 
知道 了 尾 结 点 的 地 址 ， 所 以 既 可 用 头 插 法 ， 也 可 用 尾 插 法 建 表 。 对 后 者 ， 表 中 各 结 点 的 次 

例 8.4 已 知 一 组 关键 字 和 选 定 的 散 列 函数 与 例 8.3 相同 ,用 拉链 法 解决 冲突 ， 构造 这 
组 关键 字 的 散 列 表 。 

因为 散 列 函数 H(key)=key%13 的 值 域 为 0 至 12， 故 散 列 表 为 HI[13]。 当 把 HGkey)=i 
的 关键 字 插 入 第 1 个 单 链 表 时 ， 既 可 插入 在 链表 的 头 上 ， 也 可 以 插 在 链表 的 尾 上 。 这 里 每 
次 将 新 关键 字 插 入 到 链 尾 ， 得 到 的 散 列 表 如 图 8.23 所 示 。 

上 述 同义词 链表 还 可 作 些 改进 : 

(1) 按 关 键 字 大 小 排列 记录 ， 可 提高 以 后 查找 时 的 效率 。 

(2) 按 访 问 频率 排列 记录 ， 可 提高 以 后 对 高 访问 率 记 录 的 查找 效率 。 


(3) 在 尾部 附加 一 个 监视 哨 结 点 ， 可 在 查找 时 省 略 结 点 为 空 的 检查 。 
由 于 同义词 链表 一 般 不 大 ， 这 些 方法 的 实际 意义 通常 并 不 突出 。 
与 开放 地 址 法 相 比 ， 拉 链 法 有 如 下 几 个 优点 : (1) 拉链 法 不 会 产生 堆积 现象 ， 因 而 平 


均 碍 找 长 度 较 短 ; (2) 由 于 拉链 法 中 各 单 链 表 上 的 结 点 空间 是 动态 申请 的 ， 故 更 适合 于 建 


表 前 无 法 确定 结 点 数 的 情况 ; (3) 当 疙 填 因 子 4 较 大 时 ， 拉 链 法 所 用 的 空间 会 比 开 放 地 址 
法 多 ,但 是 4 武大 ， 开 放 地 址 法 所 需 的 探查 次 数 越 大 ， 所 以 ， 拉 链 法 所 增加 的 空间 开销 是 
合算 的 。 
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查找 成 功 时 比较 次 数 1 2 3 4 
图 8.23 拉链 法 构造 散 列 表示 意图 


8.4.4 ” 散 列 表 的 查找 及 分 析 


散 列 表 的 运算 有 建 表 、 查 找 、 插 入 和 删除 等 ， 但 基本 运算 是 查找 。 因 为 敌 列 表 的 主要 
目的 是 为 了 快速 查找 ， 而 建 表 、 插 入 和 删除 均 要 用 到 查找 运算 。 

在 开 散 列 表 中 ， 删 除 结 点 的 操作 易于 实现 ， 只 要 简单 地 删 去 链表 上 相应 的 结 点 即 可 。 

但 对 闭 散 列表 ， 删 除 结 点 时 不 能 简单 地 将 被 删 结 点 的 空间 置 为 空 ， 否 则 将 截断 在 它 之 
后 填 入 散 列表 的 同义词 的 查找 路 径 。 这 是 因为 各 种 开放 地 址 法 中 ， 空 单元 〈 即 开放 地 址 ) 
都 是 查找 失败 的 条 件 。 因 此 在 用 开放 地 址 法 处 理 冲突 的 闭 散 列表 上 执行 删除 操作 ， 一 般 只 
在 被 删 结 点 上 做 删除 标记 ， 而 不 真正 删除 结 点 〈 和 否则 探查 序列 相同 甚至 交叉 的 结 点 可 能 都 
要 前 移 ， 处 理 起 来 比较 困难 )。 

相应 地 ， 在 闭 散 列表 中 插入 时 ， 千 过 到 有 删除 标记 的 地 址 ， 并 不 能 马上 将 当前 关键 字 
插入 到 该 处 ， 而 应 沿 探查 序列 继续 进行 下 去 。 这 是 因为 后 面 的 探查 序列 中 可 能 已 有 该 关键 
字 ， 插 入 后 会 导致 散 列 表 中 出 现 相 同 的 关键 字 。 为 提高 插入 (以 及 查找 ) 的 效率 ， 当 删除 
标记 较 多 时 ， 最 好 对 散 列 表 重 建 。 

散 列 表 的 查找 过 程 和 建 表 过 程 相 似 。 以 闭 散 列表 为 例 ， 假 设 给 定 的 值 为 K， 根 据 散 列 
函数 HH 计算 出 散 列 地 址 H(K)， 若 表 中 该 地 址 对 应 的 单元 为 空 ， 则 查找 失败 ， 否 则 将 该 地 
址 中 结 点 的 关键 学 与 给 定 值 K 比较 ， 夺 相等 则 查找 成 功 ， 奎 不 等 则 按 冲 突 处 理 的 方法 找 下 
一 个 地 址 ， 如 此 反复 下 去 ， 直 到 找到 某 个 空 单元 (查找 失败 ) 或 者 关键 字 相 等 的 地 址 〈 碍 
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找 成 功 ) 为 止 。 其 中 ， 散 列 函 数 和 冲突 处 理 的 方法 要 和 建 表 时 设 定 的 相同 。 
以 下 只 给 出 艇 列表 的 查找 和 插入 算法 。 
1. 闭 散 列表 的 查找 和 插入 不 考虑 删除 标记 ) 
闭 散 列表 的 类 型 定义 及 查找 和 插入 的 算法 如 下 : 


const keytype OPEN=0;  // 空 单元 标志 ， 假 设 为 0 
const int m=20; // 散 列表 长 ， 假 设 为 20 
typedef struct { 
keytype key; 
othertype other:; 
} nodetype; // 结 点 类 型 
typedef nodetype hashtable[m];// 闭 散 列 表 类 型 
int LSearch (hashtable HT, keytype K) {// 在 闭 散 列表 HT 中 找 关 键 字 为 K 的 结 点 
int d0,d,i; 
d0=H (k); 
i1=1;d=d0; 
while(i<=m && HT[d] .key!=OPEN && HT[d] .key!=K) { 
1++;d= (d0+1) $m; 
} // 线 性 探查 ， 最 多 m 次 (初始 地 址 的 检查 也 看 做 1 次 探查 ) 
return d; // 由 调用 程序 检测 是 否 HT[d]=K， 若 不 等 则 查找 失败 
} 
void LInsert (hashtable HT,nodetype s) {// 在 闭 散 列表 HT 中 插入 结 点 s 
1 
d=LSearch (HT, s.key); 
if (HT[d] .key==OPEN) HT[d]=s; 
else cout<<“ 不 能 插入 ， 结 点 已 存在 或 表 满 ! \n”; 
} 


2. 开 散 列表 的 查找 和 插入 
开 散 列表 的 类 型 定义 及 查找 和 插入 的 算法 如 下 : 


typedef struct node * pointer; // 结 点 指针 类 型 
struct node{ // 结 点 结构 
keytype key; 
othertype other; 
pointer next; 
}; 
typedef pointer chainhash[m]; // 开 散 列 表 类 型 
pointer CSearch (chainhash HT, keytype K) {// 在 开 散 列表 HT 中 找 关 键 字 为 K 的 结 点 
pointer p; 


p=HT[H (K)]; // 取 出 K 所 在 链表 的 头 指 针 
while (p!=NULL && p->key!=K) p=p->next;// 顺 序 查 找 
return p; // 由 调用 程序 检测 是 否 p==NULL， 寿 空 则 查找 失败 


} 
void CInsert (chainhash HT,pointer s) { // 在 开 散 列表 HT 中 插入 结 点 *s 
Tn 0 
pointer p; 
p=CSearch (HT, s—>key); 
if (p==NULL) { 
d=H (s->key) ;s->next=HT[d] ;HT[d]=s;// 插 入 到 链表 头 部 
} 
else cout<<“ 不 能 插入 ， 结 点 已 存在 ! \n”; 


3. 查找 分 析 

从 上 述 但 找 过 程 可 知 ， 虽 然 敌 列表 在 关键 字 和 存储 位 置 之 间 建立 了 对 应 关系 ， 但 是 由 
于 冲突 的 产生 ， 敌 列表 的 僵 找 过 程 仍然 是 一 个 和 关键 学 比较 的 过 程 ， 不 过 敌 列 表 的 平均 奔 
找 长 度 比 顺序 查找 要 小 得 多 ， 比 二 分 查找 也 小 。 下 面 仍 以 例 8.3 和 例 8.4 的 散 列 表 为 例 ， 
分 析 在 等 概率 情况 下 但 找 成 功 和 不 成 功 时 的 平均 查找 长 度 。 

对 于 成 功 的 人 查找， 所 但 找 的 关键 学 只 能 是 给 定 的 11 个 关键 学 中 的 茶 一 个 。 对 图 
8.22 (b) 所 示 的 团 敌 列表 ， 夺 要 找 关 键 字 26， 其 黎 列 地 址 为 0， 而 HTI0] 正 是 它 ， 故 内 需 
进行 1 次 比较 ; 奢 要 找 关 键 字 25, 其 敌 列 地 址 为 12, 而 HT[12] 个 是 25, 同 后 依 次 探查 HT[13]1、 
HT[14]、HT[I0] 和 HT[1]， 最 后 在 HT[1] 内 找到 ， 故 需 进行 5 次 比较 ， 类 似 可 得 到 其 他 关键 
字 的 比较 次 数 ”"， 见 图 8.22(c) 的 第 一 行 。 这 样 , 线性 探查 法 查找 成 功 时 的 平均 比较 次 数 为 : 

ASL=(1+5+1+2+2+1+1+]l+1+2+3)/11=20/11=1.82 

对 开 敌 列表 ， 见 图 8.23， 奎 要 找 的 关键 字 在 各 个 同义词 链表 中 是 第 一 个 ， 则 只 需 进行 
1 次 比较 ， 如 26、7、18 等 ; 奎 要 找 的 关键 字 在 各 个 同义词 链表 中 是 第 二 个 ， 则 需 进行 2 
次 比较 ， 如 28、64; 类 似 ， 对 关键 字 51 和 25 分 别 要 进行 3 次 和 4 次 比较 。 这 样 ， 拉 链 法 
查找 成 功 时 的 平均 比较 次 数 为 : 

ASL=(1x7+2x2+3x1+4x1)/11=18/11=].64 

而 当 n=11 时 ， 顺 序 查 找 和 二 分 查找 的 平均 三 找 长 度 为 : 

ASLso=(11+1)/2=6 

ASLun=(1xl+2x2+3x4+4x4)/11=33/11=3 

对 于 不 成 功 的 得 找 ， 顺 序 得 找 和 二 分 得 找 所 需 进 行 的 关键 字 比 较 次 数 取决 于 表 长 ， 而 
散 列 查找 所 需 进行 的 关键 学 比较 次 数 则 和 答 查 结 点 有 关 。 这 里 ， 将 等 概率 情况 下 散 列 表 在 
查找 不 成 功 时 的 平均 查找 长 度 ， 定 义 为 查找 不 成 功 时 对 关键 字 需 要 执行 的 平均 比较 次 数 。 

在 得 找 不 成 功 时 , 所 得 找 的 关键 字 可 以 是 给 定 的 11 个 关键 学 之 外 的 任何 一 个 , 有 无 穷 
多 个 。 为 便于 分 析 ， 我 们 将 它们 按 散 列 地 址 分 类 ， 由 于 散 列 图 数 H(key)%13 的 值 域 为 0 到 
12, 故 分 成 13 类 。 对 闭 散 列表 , 见 图 8.22 (b), 假设 待 查 关键 字 K 不 在 该 表 中 , 者 H(K)=0， 
则 必须 依次 将 HT[0] 到 HT[6] 中 的 关键 字 和 K 或 OPEN 进行 比较 之 后 ， 才 发 现 HT[6] 为 空 ， 
即 比较 次 数 为 7; 大 H(K)=1, 则 需 比 较 6 次 才能 确定 但 找 不 成 功 。 类 似 地 对 H(K)=2, 3，…， 
12 进行 分 析 ， 结 果 见 图 8.22 (c) 的 第 二 行 ， 所 以 得 找 不 成 功 时 的 平均 租 找 长 度 为 : 

AS (TOT TATITITITIOTITIT2T1+IO0N1I3S 45/133.456 

对 开 敌 列表 ， 见 图 8.23， 寿 符 租 关键 字 K 的 散 列 地 址 为 d=H(K)， 且 第 d 个 链表 上 具 
有 Xx 个 结 点 ， 则 当 K 不 在 此 表 上 时 ， 惑 需 做 X 次 关键 字 比 较 〈 不 包括 空 指针 判定 )， 因 此 ， 
但 找 不 成 功 时 的 平均 三 找 长 度 为 : 

ASLusee=(1]+0+2+1+0+1+0+1+0+0+1+0+4)/13=11/13=0.846 

这 里 的 13 既是 查找 不 成 功 的 种 类 数 ， 又 是 表 长 。 易 见 ， 该 结果 就 等 于 装填 因子 oa。 

敌 列 表 的 但 找 效率 与 敌 列 录 数 的 均匀 性 、 冲 突 处 理 方法 和 状 填 因子 有 关 。 如 上 述 例子 
表明 ， 敌 列 函 数 相 同 、 冲 突 处 理 方法 不 同 的 敌 列 表 ， 其 平均 但 找 长 上 度 是 不 同 的 。 一 般 我 们 


( 这 里 的 “比较 ”是 指 对 “单元 ”的 比较 或 探查 ， 因 为 纯粹 从 关键 字 比 较 上 看 ， 对 每 个 单元 x 比较 
了 2 次 : 是 否 为 空 以 及 是 否 为 所 找 : x.key!=OPEN && x.key!=KK。 参 见 前 述 闭 散 列表 的 查找 算法 。 
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假定 所 选 的 散 列 函数 是 均匀 的 ， 这 时 可 不 考虑 若 列 函数 的 影响 ， 俘 找 效率 就 只 与 冲突 处 理 
方法 和 装填 因子 有 关 。 表 8.1 给 出 了 在 等 概率 情况 下 ， 采 用 5 种 不 同方 法 处 理 冲 突 时 ， 得 
到 的 散 列 表 的 平均 得 找 长 度 。 

从 表 8.1 可 见 ， 散 列表 的 平均 得 找 长 度 不 是 结 点 个 数 n 的 函数 ， 而 是 装填 因子 a 的 函 
数 。 因 此 在 10 000 个 结 点 的 散 列 表 中 进行 查找 的 平均 比较 次 数 并 不 一 定 比 在 10 个 结 点 的 
获 列 表 中 进行 僵 找 时 大 ， 甚 至 还 小 ， 只 要 前 者 的 效 填 因子 小 于 或 等 于 后 者 即 可 。 但 其 他 基 
于 比较 的 查找， 如 顺序 僵 找 、 二 分 会 找 等 没有 这 个 特点 ， 它 们 的 平均 比较 次 数 一 般 随 结 点 
数 的 增加 而 增 大 ， 差 别 仅 在 于 增长 的 快慢 不 同 。 

表 8.1 散 列 表 的 平均 查找 长 度 
平均 查找 长 度 


成 功 的 查找 不 成 功 的 查找 


本 风光 i -1+— 
QO 
py ) 


解决 冲突 的 方法 


二 次 探查 ， 随 机 探查 
双 散 列 函 数 探查 1l—a 


在 具体 设计 散 列表 时 可 选择 a 以 控制 散 列表 的 平均 查找 长 度 。 例 如 ， 当 o=0.9 时 ， 对 


于 成 功 的 查找 ， 线 性 探查 法 的 平均 查找 长 度 是 5.5， 二 次 探查 、 随 机 探查 及 双 散 列 函 数控 
查 法 的 平均 查找 长 度 都 是 2.56， 拉 链 法 的 平均 查找 长 度 为 1.45。 显 然 ，w 越 小 ， 产 生 冲 突 


的 机 会 就 越 小 ， 查 找 速度 就 越 快 。 但 另 一 方面 ，w 越 小 ， 空 间 的 浪费 也 就 越 多 。w 值 的 具 
休 选 取 ， 可 在 查找 速度 和 空间 耗费 上 进行 权衡 。 

需要 注意 : 

(1) 表 8.1 给 出 的 是 平均 情况 ， 最 坏 情 况 显然 为 Otn)， 它 不 是 装填 因子 a 的 函数 。 

(2) 表 8.1 指 的 是 大 量 同类 问题 的 “平均 ”， 对 某 一 个 具体 问题 ， 不 能 直接 用 它 来 计算 
实际 结果 ， 只 能 用 作 估 计 。 比 如 ， 用 其 中 的 线性 探查 法 公式 计算 图 8.22 的 闭 散 列表 ， 这 时 
o-11/15-0.733， 则 查找 成 功 时 的 平均 比较 次 数 为 [1+ 了 一]-2.38， 而 不 是 上 面 计算 出 的 
1.82, 是 差别 较 大 ; 又 如 , 用 其 中 的 拉链 法 公式 计算 图 8.23 的 开 散 列表 , 这 时 a=11/13=0.846， 
则 查找 成 功 时 的 平均 比较 次 数 为 1+o/2=1.42， 也 不 是 上 面 计算 出 的 164。 一 般 地 ， 如 果 关 
键 字 个 数 n 较 大 ， 且 关键 字 分 布 比较 均匀 ， 则 实际 计算 结果 和 公式 估算 结果 比较 接近 ， 但 
对 于 线性 探查 法 ， 当 装填 因子 过 大 (如 接近 1) 时 ， 两 者 还 是 可 能 有 很 大 的 差别 ， 主 要 是 
因为 这 时 有 非常 严重 的 堆积 现象 。 

(3) 对 闭 散 列表 ， 当 oa 工时 查找 长 度 急 剧 增长 〈 趋 于 )， 效 率 极 低 ， 这 是 应 当 避 免 
的 。 其 中 不 成 功 查找 比 成 功 查找 严重 ， 线 性 探查 比 二 次 探查 严重 。 线 性 探查 法 宣 取 更 低 的 


GO 严格 地 说 ， 结 点 个 数 n 有 轻微 影响 ， 特 别 是 ma 很 小 时 (这 时 开放 地 址 法 在 a 较 大 时 受 n 的 有 影响 略 
为 明显 些 )。 

@ 若 同 义 词 链表 为 键 值 有 序 的 ， 则 该 结果 为 /2〈 有 序 表 顺序 查找 失败 时 平均 比较 一 半 的 结 点 ); 车 
把 查找 失败 时 空 指针 的 比较 也 算 做 一 次 探查 ， 则 结果 要 多 1 次 ， 如 1+a 等 。 


oa (如 二 次 探查 不 超过 0.9， 线 性 探查 不 超过 0.8 等 )。 
(4) 关键 字 出 现 的 先后 顺序 对 散 列 表 平 均 碍 找 长 度 一 般 影 啊 不 大 或 没有 影响 〈 如 线性 
探查 法 和 拉链 法 )， 这 比 二 又 排序 树 好 得 多 ， 所 以 散 列 表 中 一 般 不 考虑 输入 顺序 的 影响 。 
显然 ， 散 列 方法 主要 用 于 动态 查找 ， 但 也 可 用 于 静态 查找 。 


8.1 二 又 树 上 结 点 的 平衡 因子 只 能 为 -1, 0, 1 吗 ? 

8.2 ”能 不 能 要 求 平衡 二 又 树 所 有 结 点 的 平衡 因子 都 是 0? 能 不 能 要 求 平 衡 二 又 树 所 有 
结 点 的 平衡 因子 尽 可 能 为 0? 

8.3 aa 个 络 点 的 二 又 树 何 时 高 度 最 小 ? 何 时 高 度 最 大 ? 平均 得 找 长 度 最 大 是 多 少 ? 

84 ”深度 为 4 的 AVL 树 结 点 数 最 多 为 多 少 ? 最 少 为 多 少 ? 


8.5 线性 表 能 否 用 散 列 方法 存储 ? 

8.6 何 为 堆积 现象 ? 它 有 何人 危害 ? 

8.7 ”用 线性 探查 法 解决 冲突 ， 将 mn 个 同义词 存 入 散 列 表 时 ， 至 少 要 探查 多 少 次 ? 

8.8 ”对 关键 字 序列 43, 5, 10, 12, 17, 20, 23, 27, 31, 34, 39, 40, 41}, 用 二 分 法 查找 关键 字 
12， 写 出 查找 过 程 ， 查 找 成 功 时 经 过 了 几 次 关键 字 比 较 ? 

8.9 分别 对 结 点 数 n=10 和 n=100 的 有 序 表 进 行 二 分 查找 ， 查 找 成 功 时 平均 查找 长 度 
为 多 少 ? 查找 不 成 功 时 最 大 查找 长 度 为 多 少 ? 

8.10” 试 求 二 又 排序 树 的 平均 查找 长 度 。 

8.11 (1) 给 定 关 键 字 集 合 {1, 2, 3}， 试 画 出 所 有 可 能 的 二 又 排序 树 。 

(2) 给 定 关 键 字 集合 {1, 2,…, n}， 所 有 可 能 的 二 又 排 序 树 有 几 棵 ? 


8.12 己 知 图 8.24 为 二 又 排 序 树 ,各 结 点 值 为 {16, 30, 56, 80, 20， 
66}， 请 标 出 各 结 点 的 值 。 
8.13 已 知 关键 字 输 入 序列 {10, 17, 8, 9, 20}， 画 出 相应 的 二 又 


排序 树 ， 并 求 在 等 概率 下 查找 成 功 和 不 成 功 时 的 平均 查找 长 度 。 
8.14 试 给 出 一 种 方法 ， 可 对 任意 关键 学 序 列 ， 构 造 出 平均 查找 ”图 8.24 习题 8.12 图 
长 度 最 小 的 二 又 排序 树 。 


8.15” 给 定 关 键 字 序列 {4, 5, 7, 2, 1, 3, 6}， 试 生成 一 棵 平衡 二 又 排序 树 。 
8.16 ”已 知 某 3 阶 B 树 如 图 8.25 所 示 , 请 男 出 在 此 树 上 依次 插入 

80、32、60、46 时 B 树 变化 过 程 。 EE 
8.17” 售 8 个 关键 学 的 3 阶 B 树 最 多 几 个 结 点 ?最 少儿 个 结 点 ? 

画 出 其 形态 。 65 | 


8.18” 对 关键 字 序列 {23, 15, 7, 47, 28, 14, 26, 53, 32, 69, 81, 77} 图 8g25 习题 8 16 图 
构造 散 列表 ， 设 散 列 表 空间 为 HI[0..14]， 用 除 余 法 构造 散 列 函数 ， 用 
二 次 探 便 法 解决 冲突 ， 画 出 相应 的 散 列 表 ， 并 求 奋 找 成 功 时 的 平均 查找 长 度 。 

8.19” 设 散 列表 有 200 个 表 项 ， 用 二 次 探查 法 解决 冲突 ， 查 找 不 成 功 时 插入 新 表 项 的 
平均 探查 次 数 不 超 过 1.5， 试 设计 一 个 合适 的 散 列 表 长 度 和 相应 的 除 余 法 散 列 函数 。 
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8.20 ”对 关键 字 序 列 {11, 78, 10, 1, 3, 2, 4, 21} 构 造 散 列表 , 取 散 列 地 址 为 HT[0..10], 散 
列 函 数 为 HK)=K%11， 试 分 别 用 线性 探查 法 和 拉链 法 解决 冲突 ， 画 出 相应 的 散 列 表 ， 并 
分 别 求 查 找 成 功 和 不 成 功 时 的 平均 查找 长 度 。 大 直 接 用 公式 计算 ， 结 果 如 何 ? 

8.21 ”假设 对 顺序 表 进行 从 前 问 后 的 顺序 查找 ， 试 写 出 相应 的 算法 。 

8.22 ” 试 写 出 链表 上 的 顺序 查找 算法 。 

8.23” 试 写 出 二 分 查找 法 的 递归 算法 。 

8.24 ”怎样 使 二 又 排序 树 的 结 点 按 从 大 到 小 的 顺序 输出 ? 

8.25 ”编写 算法 ， 判 断 二 又 树 是 否 为 二 又 排 序 树 。 

8.26 ” 试 编写 非 递 归 算法 ， 分 别 对 二 又 排序 树 : (1) 插入 ; (2) 查找 。 

8.27” 某 闭 散 列表 装填 因子 小 于 1， 散 列 函 数 为 关键 字 第 一 个 字母 在 字母 表 中 的 序号 ， 
按 线性 探查 法 解决 冲突 。 试 编写 算法 ， 按 第 一 个 字母 的 顺序 输出 散 列 表 的 所 有 关键 字 。 

8.28 ” 试 编写 算法 ， 求 等 概率 下 开 散 列表 中 查找 不 成 功 时 的 平均 查找 长 度 。 


文件 | 


前 面 各 章 讨 论 的 数据 结构 都 是 针对 内 存 〈《 内 部 存储 亏 ) 的 。 但是， 如 果 数 据 的 “规模 ” 
很 大 〈 数 据 量 大 ,包含 的 数据 元 素 多 )、 或 者 需要 长 期 保存 ， 则 必须 存放 在 外 存 〈 外 部 存储 
船 ) 中 。 通 第 将 存放 在 外 存 中 的 数据 称 为 文件 ， 文 件 与 外 存 密 切 相 关 。 外 存 与 内 存储 需 的 
物理 特性 不 同 ， 其 使 用 也 有 很 大 不 同 ， 前 面 介 绍 的 各 种 数据 组 织 方 法 和 操作 方法 不 能 简单 
地 照搬 过 来 ， 需 要 根据 文件 的 特点 专门 加 以 考虑 。 

本 章 讨 论文 件 的 锡 辑 特性 、 存 储 结构 等 问题 ， 包 括 顺 序 文件 、 索 引文 件 、 索 引 顺 序 文 
件 、 敌 列 文件 和 多 关键 学 文件 。 


81 文件 的 基本 概念 


9.1.1 文件 结构 


文件 (File〉 是 外 存 中 性 质 相 同 的 阁 干 记录 的 集合 ， 每 个 记录 由 一 个 或 多 个 数据 项 构 
成 。 记 录 也 就 是 以 前 所 说 的 数据 元 素 ， 它 是 文件 存 取 的 基本 单位 ， 数 据 项 是 文件 可 使 用 的 
最 小 单位 。 数 据 项 有 时 也 称 为 字段 、 域 (Field) 或 属性 (Attribute)。 可 见 ， 数 据 结构 中 所 
讨论 的 文件 是 指数 据 库 意义 上 的 文件 ， 记 录 是 有 结构 的 ， 而 不 是 操作 系统 意义 上 的 文件 。 
操作 系统 中 研究 的 文件 是 一 维 无 结构 的 连续 字符 序列 ， 提 供 对 文件 的 整体 操作 (如 打开 文 
件 、 关 闭 文件 、 删 除 文件 、 复 制 文件 等 ) 和 字 节 操作 〈 从 文件 读 一 字 节 、 写 一 字 节 到 文件 
中 等 )。 另 外 ， 数 据 结构 讨论 的 文件 是 指 文 件 结构 ， 而 不 是 数据 库 本 丑 。 

例如 ， 图 9.1 是 一 个 简单 的 职工 档案 文件 ， 每 个 职工 的 信息 组 成 一 个 记录 ， 单 位 有 多 
少 人 ,文件 就 有 多 少 条 记录 。 每 个 记录 由 4 个 数据 项 组 成 : 职工 号 、 姓 名 、 性 别 、 年 龄 等 ， 
每 个 数据 项 表示 职工 的 某 方面 的 信息 ， 其 中 “职工 号 ”可 作为 主 关 键 字 ， 而 姓名 、 人 性 别 等 
只 能 作为 次 关键 字 。 


9.1 文件 示例 


Yo 数据 结构 教程 与 题解 


这 里 主 /次 关键 字 的 概 您 ， 见 排序 一 章 所 述 。 

对 用 户 来 说 ， 文 件 记 录 应 是 存 取 的 基本 单位 。 但 外 存 设备 《如 磁盘 、 破 市 ) 一 般 是 按 
一 定 大 小 的 物理 块 〈 币 称 作 页 块 ) 存 取 的 ， 它 是 外 存 存 取 的 基本 单位 ， 一 般 可 存放 多 个 记 
录 。 为 了 区 分 这 两 种 标准 ,通常 将 按 用 户 观 点 看 的 基本 存 取 单 位 ( 即 记 录 ) 称 为 逻辑 记录 ， 
将 按 外 存 设备 观点 看 的 基本 存 取 单 位 称 为 物理 记录 。 

文件 可 以 按照 记录 中 关键 字 的 多 少 ， 分 成 单 关键 字 文件 和 多 关键 字 文 件 。 大 文件 中 的 
记录 只 有 一 个 关键 子 (为 主 关键 子 ) 则 称 单 关键 字 文 件 ; 各 文件 中 的 记录 除了 主 关 键 子 外 ， 
还 含有 奋 干 个 次 关键 和 子 ， 则 称 为 多 关键 字 文 件 。 

文件 还 可 分 成 定 长 文件 和 不 定 长 文件 。 夺 文件 中 各 记录 含有 的 信息 长 上 度 相 同 ， 则 这 类 
记录 称 为 定 长 记录 ， 由 定 长 记录 组 成 的 文件 称 为 定 长 文件 ， 夺 文件 中 各 记录 含有 的 信息 长 
度 不 等 ， 则 称 为 不 定 长 文件 。 图 9.1 所 示 的 职工 文件 是 一 个 定 长 文件 。 

类 似 其 他 数据 结构 ,文件 结构 也 包括 好 辑 结 构 、 存 储 结构 及 文件 上 的 各 种 操作 (运算 ) 
这 三 个 方面 。 其 中 ， 文 件 操作 定义 在 多 辑 结构 上 ， 操 作 的 具体 实现 在 存储 结构 上 进行 。 

1. 文件 的 逻辑 结构 及 操作 

文件 是 记录 的 集合 ， 即 其 逻辑 结构 为 集合 。 但 一 个 文件 的 各 个 记录 一 般 会 按照 某 种 次 
序 排列 起 来 〈 这 种 排列 的 次 序 可 以 是 记录 中 关键 字 的 大 小 ， 也 可 以 是 各 个 记录 存 入 该 文件 
的 时 间 先 后 等 )， 各 记录 之 间 瓯 目 然 地 形成 了 一 种 线性 关系 。 因 此 , 文件 也 可 看 成 一 种 线性 
结构 ， 或 者 说 是 存储 在 外 存 上 的 线性 表 。 

类 似 于 线性 表 ， 文 件 的 基本 运算 有 : 谈 、 写 、 定 位 、 插 入 、 删 除 等 ， 它 们 可 归 为 两 类 : 
检索 和 修改 。 除 了 基本 运算 ， 文 件 操作 还 有 : 为 提高 文件 效率 进行 的 再 组织、 文件 被 破坏 
后 的 恢复 、 文 件 中 数据 的 安全 保护 等 ， 这 些 内 容 和 文件 的 修改 可 统称 为 维护 ， 所 以 ， 从 大 
的 方面 看 ， 也 可 把 文件 的 操作 分 为 如 下 两 关 : 检索 和 维护 。 

检索 就 是 在 文件 中 僵 找 满足 给 定 条 件 的 记录 ， 它 既 可 以 按 记 录 的 好 辑 写 (记录 进 入 文 
件 时 的 顺序 编号 ) 查找 ， 也 可 按 关 键 字 查找 。 这 种 在 外 存 中 读 取 或 定位 记录 的 方式 称 为 存 
取 方 式 。 基 本 的 存 取 方 式 有 以 下 几 种 : 

(1) 顺序 存 取 。 依 次 存 取 一 个 旬 辑 记录 。 在 上 号 记录 谈 取 之 前 ， 序 号 比 k 小 的 记录 必 
须 已 被 谈 取 过 。 

(2) 直接 存 取 《〈 随 机 存 取 )。 直 接 存 取 第 i 个 逻辑 记录 ， 不 需 等 竺 其 前 面 记录 的 读 取 。 

(3) 按 关 键 字 存 取 。 存 取 键 字 与 给 定 值 相等 《或 相关 ) 的 记录 。 对 数据 库 文 件 可 以 有 
如 下 4 种 得 询 方式 : 

J 精确 得 询 。 奉 询 关 键 字 等 于 给 定 值 的 记录 。 例 如 ， 碍 询 已 知 职工 号 或 姓名 的 记录 。 

节 范围 得 询 。 碍 询 关 键 字 在 东 个 范围 内 的 记录 。 例 如 ， 碍 询 25 岁 到 30 岁 的 职工 。 

(3) 函数 会 询 。 给 定 关 键 字 的 条 个 函数 进行 公 询 。 例 如 ， 僵 询 所有 职工 的 平均 年 龄 。 

4) 组 合租 询 。 碍 询 关 键 字 满足 多 个 条 件 的 记录 。 例 如 ， 碍 询 30 岁 以 上 的 男 职 工 。 

修改 是 指 对 文件 进行 记录 的 插入 、 删 除 及 更 新 等 操作 。 插 入 、 删 除 是 针对 整 条 记录 而 
言 的 ， 如 对 图 9.1 所 示 文 件 ， 硅 王刚 调 到 了 其 他 单位 ， 则 在 文件 中 把 他 的 记录 删除 ， 赵 腕 
新 分 配 到 了 本 单位 ， 则 在 文件 中 增加 他 的 记录 。 记 录 的 更 新 是 针对 记录 的 字段 而 言 的 ， 如 
发 现 李 芳 的 年 龄 弄 错 了 ， 不 是 27 应 该 为 23， 将 它 改正 过 来 等 。 

文件 的 检索 和 修改 都 有 实时 和 批量 两 种 处 理 方式 。 实 时 处 理 的 时 间 要 求 较 严 ， 一 般 要 
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在 短 时 间 内 如 儿 秒 钟 内 〉 迅速 完 成 ， 批 量 处 理 的 时 间 要 求 较 松 ， 可 以 在 定期 或 不 定期 的 
一 段 时 间 后 进行 。 例 如 ， 民 航 、 铁 路 售 架 系统 ， 检 索 和 修改 都 应 当 实 时 处 理 ， 而 银行 的 账 
户 系 统 需 要 实时 检索 ， 但 可 进行 批量 修改 ， 即 可 以 将 一 天 的 存 球 和 提 球 信息 记录 在 一 个 事 
务 文件 上 ， 在 一 天 的 营业 之 后 再 进行 集中 处 理 。 

2. 文件 的 存储 结构 

文件 的 存储 结构 〈 亦 称 物理 结构 )， 是 指 文件 在 外 存 上 的 组 织 方 式 。 文 件 的 组 织 方式 
很 多 ， 采 用 不 同 的 组 织 方式 就 得 到 不 同 的 存储 结构 。 基 本 的 组 织 方 式 有 4 种 : 顺序 组 织 、 
索引 组 织 、 敌 列 组 织 和 链 组 织 ， 其 他 方式 往往 是 这 4 种 基本 方式 的 结合 。 按 这 4 种 方式 组 
织 的 文件 分 别称 为 顺序 文件 、 索 引文 件 、 敌 列 文件 和 链 式 文件 。 其 中 链 式 文件 第 闸 结 合 索 
引文 件 一 起 使 用 ， 如 多 关键 字 文 件 。 链 式 文件 的 链 结 点 一 般 很 大 且 不 定 长 ， 其 链 结 点 除 包 
插 结 点 本 映 的 内 容 和 链 指 针 〈 地 址 ) 外 ， 还 包括 结 点 长 度 〈 对 不 定 长 结 点 )。 

选择 哪 一 种 文件 组 织 方式 ， 取 决 于 对 文件 中 记录 的 使 用 方式 和 使 用 频 震 程度 、 存 取 要 
求 、 外 存 的 性 质 和 容量 等 。 

评价 一 个 文件 组 织 的 效率 ， 是 执行 一 个 文件 操作 所 人 花费 的 时 间 和 文件 组 织 所 需 的 存储 
空间 。 通 党 文件 组 织 的 主要 目的 ， 是 为 了 能 高 效 、 方 便 地 对 文件 进行 操作 ， 而 检索 功能 区 
多 少 和 速度 的 快慢 ， 有 是 衡量 文件 操作 质量 的 重要 标 关 ， 因 此 ， 如 何 提高 检索 的 效率 ， 是 研 
究 各 种 文件 组 织 方式 首先 要 关注 的 问题 。 


9.1.2 ”外 存储 器 简介 


外 存储 器 简称 外 存 ， 是 内 存 的 下 级 存储 器 ， 用 于 存储 大 量 数据 和 永久 保存 ， 还 可 用 作 
数据 缓冲 。 计 算 机 中 CPU 的 操作 ， 一 般 针 对 的 是 内 存 中 的 数据 。 涉 及 外 存 的 操作 ， 一 般 只 
是 成 块 的 输入 和 输出 〈 传 输 )。 为 了 讨论 文件 的 组 织 方 式 ， 有 必要 介绍 一 下 外 存储 器 特别 是 
磁 市 和 磁盘 的 一 些 知识 。 

外 存 设 备 大 体 上 可 分 为 顺序 存 取 〈 如 磁带 ) 和 直接 存 取 〈 如 磁盘 ) 两 大 类 。 现 在 常见 
的 外 存 主 要 有 磁盘 〈 软 盘 、 硬 盘 )、 磁 带 、 光 盘 、 闪 盘 (俗称 U 盘 ) 等 。 其 中 硬盘 很 长 时 
间 以 来 都 是 主流 外 存 ， 在 操作 系统 或 应 用 系统 中 ， 它 是 内 存 的 直接 延伸 ， 应 用 程序 和 操作 
系统 的 活动 数据 ， 都 存储 在 硬盘 中 。 其 他 外 存 一 般 作 后 备 存 储 器 。 对 于 海量 〈 小 量 ) 数据 
的 储存 和 备份 ， 以 前 第 用 磁 珊 《软盘 )， 现 在 则 被 光盘 〈 闪 盘 ) 逐渐 取代 。 磁 盘 、 磁 带 利 用 
磁 介 质 的 磁化 与 否 记录 信息 ， 光 盘 利用 激光 对 特殊 材料 “ 刻 痕 入 ”内 盘 对 闪存 进行 电 探 写 
(无 需 机 械 式 装置 )， 后 两 者 超出 本 书 范 围 ， 这 里 不 做 介绍 。 

1. 磁带 

磁带 存储 器 用 磁带 记录 信息 ， 磁 之 机 可 以 控制 磁带 前 进 、 后 退 ， 人 磁带 机 上 的 读 写 磁头 
可 以 谈 与 磁 斋 上 的 信息 。 磁 市 的 运行 情况 类 似 于 录音 机 磁 市 的 运行 ， 如 图 9.2 所 示 。 

磁带 有 不 同 的 规格 ， 如 带宽 〈1/4 英寸 、1/2 英寸 等 )、 带 长 〈2 400 英尺 、1 200 英尺 
等 )、 存 储 密度 (1 600 位 /英寸 、3 200 位 /英寸 等 )、 磁 道 数 (9 道 、16 道 等 ) 等 。 常 用 的 
磁带 一 般 为 1/2 英寸 宽 ， 最 长 可 达 3 600 英尺 。 图 9.3 是 一 段 9 道 磁带 ， 带 面 在 横向 每 排 可 
记录 9 位 二 进 制 信息 ， 其 中 8 位 组 织 成 一 个 字 节 ， 男 一 位 为 奇偶 校 验 位 。 

磁 融 上 的 信息 是 以 块 为 单位 存放 的 。 一 个 信息 块 由 有 干 字 节 构 成 ， 如 1KB~8KB。 一 
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个 信息 块 就 是 磁 市 存储 占 的 一 个 物理 记录 。 通 第 一 个 信息 块 可 存放 多 个 迪 辑 记录 。 要 读 写 
条 一 个 块 上 的 信息 ， 自 先 要 定位 ， 即 通过 磁 市 的 知 动 使 磁头 对 准 被 读 块 的 前 闹 。 磁 市 不 是 
连续 运转 的 设备 ， 而 是 一 种 局 集 设 备 。 为 适应 局 动 时 的 加 速 和 集 止 时 的 滑动 ， 伺 市 上 块 与 
块 之 间 需 要 留 出 间 队 《Inter Block Gap)。 间 际 通 第 1/4~~3/4 天 寸 长 。 间 际 是 一 段 空 日 区 ， 


不 存放 数据 信息 。 
几 磁 头 二 一 一 一 纵 回 Ce 
磁带 前 进 方 问 | 
源 带 接受 盘 
9.2 ” 磁 市 的 运行 示意 图 图 9.3 9 道 带 示意 图 


磁带 存储 器 是 一 种 顺序 存储 设备 ， 它 的 主要 缺点 是 读 写 速度 慢 。 磁 带 存 取 速 度 取决 于 
磁带 的 存储 密度 和 走 带 速度 ， 实 际 上 磁带 花 在 定位 上 的 时 间 往 往 比较 长 ， 如 果 磁 头 离 所 找 
的 块 很 远 时 ， 往 往 要 几 分 钟 甚至 十 几 分 钟 才 能 定位 。 因 此 磁带 存储 器 适合 于 顺序 存 取 ， 即 
读 写 一 块 之 后 ， 下 一 次 读 写 它 后 边 的 相 邻 块 ， 这 样 可 以 减少 定位 时 间 。 

2. 软盘 

软盘 是 通过 在 圆 形 软 质 塑性 材料 上 涂 上 磁性 物质 形成 的 (形成 磁 介 质 )。 磁 性 物质 可 
通过 电 的 作用 处 于 “磁化 ”和 “未 磁化 ”两 种 状态 。 两 种 状态 分 别 用 来 表示 二 进 制 1 和 0。 
软盘 一 般 有 3 英寸 和 5 英寸 、 单 面 和 双 面 、 低 密 和 高 密 之 分 ， 如 以 前 常见 的 一 种 双 面 高 密 
3 英寸 软盘 ， 容 量 为 1.44MB。 

为 了 方便 使 用 磁 介 质 ， 将 盘面 逻辑 划分 为 若干 同心 圆 (磁盘 有 。/ 肩 自 
点 像 唱片 ， 但 唱片 是 螺旋 线 )， 每 个 同心 圆 称 为 一 个 磁道 。 圆 形 盘面 
上 再 罗 辑 划分 为 若干 扇 区 。 这 样 ， 每 个 磁道 被 扇 区 划分 为 若干 扇 段 ， A 
如 图 9.4 所 示 。 一 个 虱 段 一 般 可 存储 在 干 字 节 。 虱 段 一 般 是 CPU 或 六 CN 
其 他 设备 读 写 的 基本 单位 (存储 单元 )。 WE 

磁道 和 扇 段 都 编号 使 用 。 按 磁道 和 扇 段 的 观点 ， 每 个 盘面 是 一 
个 二 维 存储 区 。 每 个 存储 单元 ( 扁 段 ) 的 地 址 为 〈 磁 道 号 ， 扇 区 号 )。 

在 实际 使 用 中 ,也 经 常 依 某 种 方式 , 将 此 二 维 结构 映射 为 一 维 。 图 94 嫩 面 示意 图 
比如 ， 可 以 给 0 道 0 扇 区 的 扇 段 编号 为 0，0 道 1 扇 区 的 扇 段 编 号 为 1，……， 其 余 类 推 ， 
0 道 编 完 后 ， 接 着 依次 为 其 他 道 (1 道 、2 道 、……) 上 的 扇 段 编 以 连续 的 号 。 这 样 ， 二 维 
结构 就 映射 为 一 维 结构 了 。 

3， 硬 盘 

在 硬盘 中 有 若干 个 盘 片 ， 它 们 通过 一 个 主轴 串 在 一 起 ， 构 成 一 个 盘 组 ， 其 中 第 一 片 和 
最 后 一 片 向 外 侧 的 一 面 一 般 不 存放 信息 。 每 个 盘 片 采用 刚性 材料 以 适应 高 速 旋 转 的 要 求 。 
各 个 盘面 上 半径 相同 的 磁道 合 在 一 起 称 作 一 个 柱 面 ， 不 同 半径 的 磁道 的 数目 ， 就 是 柱 面 的 
数目 。 盘 组 有 多 少 个 盘面 ， 则 说 柱 面 有 多 少 个 磁道 。 柱 面 、 盘 面 、 磁 道 都 编号 使 用 。 其 中 ， 
磁道 有 两 个 编号 : 为 了 指明 它 在 所 在 盘面 上 的 位 置 ， 需 要 一 个 盘面 上 的 编号 ， 为 了 指明 它 
在 所 在 柱 面 上 的 位 置 ， 又 需要 一 个 柱 面 上 的 编号 。 前 者 就 是 柱 面 号 ， 后 者 就 是 盘面 号 。 
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因此 ， 盘 组 上 的 存储 单元 〈 扇 段 ) 的 地 址 为 三 维 结构 〈 柱 面 号 ， 盘 面 号 ， 导 区 号 )。 

每 个 盘面 都 设置 读 写 磁 头 来 读 写 各 上 自 的 数据 。 读 写 磁 头 有 两 种 类 型 ， 一 种 是 固定 头 ， 
即 每 个 盘 的 每 个 磁道 都 对 应 痢 一 个 专用 的 磁头 ， 这 种 方式 特点 是 速度 快 ， 但 结构 复杂 ， 造 
价 高 。 目 前 广泛 使 用 的 是 活动 头 ， 即 每 个 盘面 上 只 对 应 一 个 磁头 ， 安 放 在 活动 臂 上 ， 通 过 活 
动 侣 的 进退 找到 指定 柱 面 上 的 磁道 。 所 有 磁头 在 每 一 时 刻 总 是 对 准 同 一 个 柱 面 上 的 各 个 磁 
道 。 图 9.5 是 磁盘 组 的 示意 图 。 

读 写 盘 组 上 的 信息 ， 首 先 要 经 过 定位 动作 : 

(1) 选 定 柱 面 。 通 过 磁头 臂 移动 使 磁头 对 准 指定 的 
柱 面 。 这 是 机 械 动 作 ， 包 括 磁 头 臂 的 启动 、 移 动 、 停 止 ， 
目前 平均 要 几 毫 秒 至 十 几 毫 秒 ， 速 度 慢 。 

(2) 选 定 磁 道 ( 即 盘 面 )。 即 选择 对 应 着 所 需 盘 面 的 
磁头 ， 这 由 电子 线路 实现 ， 速 度 快 。 

(3) 选 定 扇 段 ( 即 物理 记录 )。 磁 头 定 位 到 要 读 写 骨 
而 段 ， 这 是 机 械 动 作 ， 通 过 盘 组 的 旋转 实现 ， 磁 头 只 是 
等 待 需 要 的 扇 段 旋转 到 自己 下 面 。 因 为 盘 组 的 旋转 不 需 
要 停止 ， 故 比 寻 道 时 间 少 ， 但 一 般 也 是 宫 秒 级 。 

经 过 定位 后 ， 真 正 用 于 读 写 信息 的 时 间 比 定位 时 间 少 得 多 。 

与 磁带 存储 器 相 比 ， 磁 盘 〈 特 别 是 人 硬盘) 存储 器 的 优点 是 存 取 速 度 快 ， 既 适应 于 顺序 
存 取 ， 又 适应 于 随机 存 取 。 

4. 缓冲 技术 

由 于 外 存 速 度 慢 ， 为 了 提高 数据 读 写 速 度 ， 可 尽量 减少 访问 外 存 次 数 。 这 可 采用 缓存 
(Caching) 或 缓冲 〈Buffermng) 技术 : 在 每 次 访问 外 存 时 ， 顺 便 将 更 多 的 数据 读 入 内 存 的 
一 个 暂 存 区 域 ( 称 为 缓冲 区 )， 这 样 下 次 访问 其 他 数据 时 ， 有 可 能 在 已 读 入 的 数据 中 进行 ， 
而 不 必 再 次 读 外 存 。 绥 冲 或 缓存 技术 是 外 设 〈( 包 括 外 存 ) 使 用 中 的 一 项 关键 技术 ， 它 使 主 
机 不 必 将 大 量 的 时 间 浪 费 在 等 等 慢 速 的 外 设 上 。 

外 设 〈 包 括 磁盘 等 外 存 ) 往往 可 与 CPU 并 行 工 作 ， 因 此 ， 可 在 CPU 使 用 缓冲 区 的 同 
时 ， 也 让 外 设 对 缓冲 区 读 写 数据 ， 以 进一步 提高 访问 速度 。 如 果 存 在 共享 资源 〈( 绥 冲 区 ) 
的 访问 冲突 ， 则 可 设立 多 个 缓冲 区 。 这 多 个 缓冲 区 称 为 绥 冲 池 。 

采用 缓冲 技术 后 ， 主 机 对 外 存 数 据 并 不 进行 直接 的 存 取 ， 如 要 读 外 存 上 的 数据 ， 首 先 
由 有 关 通 道 将 数据 读 到 缓冲 区 ， 然 后 从 缓冲 区 读 取 数据 ;， 写 数据 时 ， 将 数据 送 到 缓冲 区 ， 
绸 由 有 关 通 道 将 数据 写 到 外 存 。 一 次 从 外 存 读 数据 或 回 外 存 写 数据 的 过 程 称 作 一 次 访 外 。 
一 次 访 外 可 传送 有 和 干 字 节 ， 访 外 时 间 包 括 定 位 和 传送 时 间 ， 贡 省 存 取 时 间 的 一 个 有 效 方法 
是 使 每 次 访 外 时 在 内 存 和 外 存 之 间 传 送 较 大 一 批 数据 ， 从 而 减少 访 外 次 数 。 

分 页 块 的 存储 方法 是 一 种 有 利于 减少 访 外 次 数 又 便于 管理 的 方法 ， 一 个 页 块 是 磁带 或 
磁盘 上 的 一 个 物理 记录 ， 它 包括 多 个 逻辑 记录 ， 内 存 中 设置 的 缓冲 区 应 该 和 页 块 的 大 小 相 
等 。 每 次 访 外 是 把 一 个 页 块 读 入 绥 冲 区 或 把 缓冲 区 写 入 页 块 。 硅 一 次 访 外 所 传送 的 页 块 上 
有 多 个 要 在 近期 进行 处 理 的 迎 辑 记录 ， 则 分 页 块 的 存储 方法 可 以 使 访 外 次 数 大 大 减少 。 

这 里 我 们 可 用 访 外 次 数 作 为 衡量 检索 效率 的 一 个 主要 参数 。 检索 一 次 , 访 外 次 数 越 少 ， 
效率 就 越 高 ， 反 之 ， 效 率 就 越 低 。 男 一 个 衡量 检索 效率 的 参数 是 磁头 定位 时 间 。 检 索 某 一 
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记录 ， 磁 头 定位 时 间 越 少 ， 效 率 就 越 高 ， 反 之 ， 效 率 就 越 低 。 
(9.2” 顺 序 文件 


顺序 文件 (Sequential File〉 是 文件 的 一 种 常见 组 织 形式 。 在 顺序 文件 中 ， 记 录 按 进入 
文件 (外 存 〉 的 先后 顺序 存放 ， 其 好 辑 顺 序 和 物理 顺序 一 臻 。 夺 顺序 文件 中 的 记录 按 其 主 
关键 字 有 序 ， 则 称 此 顺序 文件 为 顺序 有 序 文件 ; 否则 称 为 顺序 无 序 文件 。 为 了 提 高 检索 效 
率 ， 和 常常 将 顺序 文件 组 织 成 有 序 文件 ， 本 市 也 假定 顺序 文件 是 有 序 的 。 

顺序 文件 要 求 占 用 一 片 连续 的 外 存 区 域 。 这 里 的 连续 是 指 外 存 访问 意义 下 的 连续 ， 即 
物理 记录 的 连续 。 一 般 情况 下 ， 外 存 可 视 为 届 段 的 连续 体 。 在 特殊 情况 下 ， 也 按 柱 面 、 盘 
面 、 扇 段 的 读 写 顺序 安排 记录 。 同 一 个 柱 面 上 的 同一 盘面 号 上 的 记录 ， 认 为 是 连续 的 。 如 
果 文 件 较 大 而 外 存 空 间 又 比较 零乱 ， 可 能 需要 先 借助 有 关 工 具 进 行 碎片 整理 。 一 般 操 作 系 
统 会 尽量 将 属于 同一 文件 的 内 容 安排 在 一 片 连续 区 中 。 

顺序 文件 适合 于 顺序 存 取 和 成 批 处 理 。 顺 序 文件 特别 适合 磁 币 存储 器 ， 也 适应 磁盘 存 
储 器 。 顺 序 文 件 的 检索 操作 方法 如 下 : 

(1) 顺序 存 取 。 从 文件 的 第 一 个 记录 开始 依次 逐个 地 恋 入 各 个 记录 进行 处 理 和 使 用 。 
要 检索 第 i 个 记录 ， 必 须 检 索 它 之 前 的 1 个 记录 。 这 对 少量 的 检索 是 不 经 济 的 ， 但 适合 
于 批量 检索 〈 类 似 下 面 的 批量 修改 )， 这 时 效率 很 高 ， 因 为 省 去 了 许多 磁头 定位 的 时 间 。 

(2) 随机 存 取 。 对 顺序 文件 的 这 种 检索 方式 ， 由 于 没有 建立 逻辑 记录 和 物理 记录 之 间 
的 直接 对 应 关系 ， 每 次 检索 都 要 从 文件 的 第 一 记录 开始 找到 所 要 处 理 的 记录 。 这 样 要 花费 
许多 定位 时 间 ， 因 此 顺序 文件 的 随机 存 取 效 率 很 低 。 

(3) 按 关 键 字 存 取 。 即 查找 指定 键 值 的 记录 。 最 简单 的 方法 是 顺序 查找 ， 从 文件 头 到 
文件 尾 扫 摘 每 个 记录 ， 奉 找到 则 人 停止， 否则， 继续 租 找 ， 直 到 文件 尾 。 帮 检索 各 个 记录 的 
概率 相同 ， 则 一 次 检索 平均 要 扫描 文件 一 半 的 记录 。 设 文件 占用 的 页 块 数 为 N， 则 平均 访 
外 次 数 为 NM2， 速 度 很 慢 。 

一 切 存储 在 顺序 存 取 存 储 器 《〈 如 磁带 ) 上 的 文件 只 能 是 顺序 文件 ， 且 只 能 进行 顺序 查 
找 。 存 储 在 直接 存 取 存 储 器 〈 如 磁盘 ) 上 的 文件 可 以 是 顺序 文件 ， 也 可 以 是 其 他 文件 (如 
索引 文件 )。 对 于 磁盘 顺序 文件 ， 除 了 顺序 查找 外 ， 告 是 有 序 的 ， 还 可 以 用 分 块 查 找 、 二 分 
查找、 插值 查找 等 。 其 中 ， 二 分 便 找 只 能 对 较 小 的 文件 或 一 个 文件 的 索 引进 行 查 找 ， 当 文 
件 很 大 ， 在 磁盘 上 占有 多 个 柱 面 时 ， 二 分 查找 将 引起 磁头 来 回 移动 ， 增 加 寻 道 时 间 。 

顺序 文件 的 修改 操作 比较 困难 ， 它 不 能 像 顺序 表 那 样 进行 插入 、 删 除 和 更 新 〈 铬 更 新 
关键 字 ， 则 相当 于 删除 后 再 插入 )， 因 为 文件 中 的 记录 不 能 像 癌 量 空间 的 数据 那样 “移动 ”， 
只 能 通过 复制 整个 文件 的 方法 来 实现 。 为 了 减少 操作 的 代价 ， 通 党 采用 批量 处 理 的 方式 来 
完成 。 这 一 方式 需要 引入 一 个 附加 文件 ( 常 称 为 事务 文件 )， 用 来 存放 对 顺序 文件 (又 称 主 
文件 ) 的 修改 请 求 。 当 修改 请 求 积累 到 一 定数 量 、 事 务 文件 变 得 足够 大 时 ， 开 始 实施 批量 
处 理 : 首先 将 事务 文件 按 主 关键 字 排 序 ， 再 根据 事务 文件 对 主 文 件 进行 一 次 全 面 的 修改 ， 
产生 一 个 新 的 主 文 件 ， 然 后 ， 清 空 事务 文件 ， 以 便 用 来 积累 此 后 的 修改 请 求 。 上 述 修改 过 
程 类 似 于 对 事务 文件 和 主 文件 执行 二 路 归并 (注意 事务 文件 和 主 文件 都 是 有 序 的 ), 基本 步 
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又 是 : 同时 对 事务 文件 和 主 文 件 扫描 。 扫 抄 中 ， 对 事务 文件 中 的 每 一 个 请 求 Q: 大 Q 是 删 
除 或 更 新 请 求 , 则 当 扫 描 到 主 文件 中 与 Q 键 值 相等 的 记录 及 时 依 Q 对 R 进行 删除 或 更 新 ; 
在 Q 是 插入 请 求 ， 则 等 主 文件 扫描 到 适当 位 置 时 执行 插入 动作 。 

顺序 文件 的 主要 优点 是 连续 存 取 的 速度 较 快 ， 适 宜 于 顺序 存 取 和 成 批 处 理 。 夺 顺序 文 
件 中 第 i 个 记录 刚 被 存 取 过 ， 而 下 一 个 要 存 取 的 是 第 计 l 个 记录 ， 则 这 次 存 取 将 会 很 快 完 
成 。 夺 顺序 文件 存放 在 单一 存储 设备 (如 人 磁 市 ) 上 时 ， 这 个 优点 总 是 可 以 保持 的 ， 但 大 它 
是 存放 在 多 路 存储 设备 《如 磁盘 ) 上 时 ， 则 在 多 着 程序 的 情况 下 ， 由 于 别 的 用 户 可 能 使 磁 
头 移 问 其 他 柱 面 ， 就 会 降低 这 一 优点 。 因 此 ， 顺 序 文 件 多 用 于 厂 市 。 
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用 索引 的 方法 组 织 文 件 时 , 通常 是 在 文件 本 喘 ( 称 为 主 文件 ) 之 外 ， 另 外 建立 一 张 表 ， 
它 指明 逻辑 记录 和 物理 记录 之 间 的 一 一 对 应 关系 ， 这 张 表 就 叫做 索引 表 。 由 索引 表 和 主 文 
件 两 部 分 一 起 构成 的 文件 称 为 索引 文件 ， 它 在 存储 器 上 分 为 两 个 区 : 索引 区 和 数据 区 。 使 
用 索引 的 目的 是 为 了 快速 访问 记录 ， 由 于 文件 数据 量 大 ， 且 存储 在 慢 速 设备 上 ， 这 一 目的 
更 加 突出 ， 特 别 是 在 数据 库 系 统 中 ， 更 是 广泛 使 用 了 索引 。 

索引 表 中 的 每 一 项 称 作 索 引 项 ， 索 引 项 一 般 是 由 关键 字 〈 或 迎 辑 记录 号 ) 与 相应 记录 
的 物理 地 址 组 成 的 。 显 然 ， 索 引 表 必须 按 关 键 字 有 序 , 大 主 文件 本 身 也 按 同 一 关键 学 有 序 ， 
则 称 为 索引 顺序 文件 (Indexed Sequential File )， 盏 则 称 为 索引 非 顺 序 文件 (Indexed 
Nonsequential File )。 如 果 没 有 特别 强调 ， 通 常 所 说 的 索引 文件 一 般 指 索引 非 顺 序 文件 ， 本 
节 只 讨论 这 种 文件 。 

对 于 索引 非 顺 序 文件 , 由 于 主 文件 中 记录 是 无 序 的 ,必须 为 每 个 记录 建立 一 个 索引 项 ， 
这 样 建立 的 索引 表 称 为 稠密 索引 。 对 于 索引 顺序 文件 ， 由 于 主 文件 中 记录 按 关 键 字 有 订 ， 
则 可 对 一 组 记录 《如 对 应 一 个 物理 记录 ) 建立 一 个 索引 项 ， 这 种 索引 表 称 为 黎 忠 索引 。 

在 建立 文件 数据 的 同时 ， 系 统 按 用 户 要 求 目 动 建立 索引 表 。 开 始 时 ， 索 引 项 按 记 录 的 
先后 顺序 排列 ， 此 时 索引 表 是 无 序 的 ， 竺 全 部 记录 输入 完毕 后 ， 上 册 对 索引 表 进 行 排 序 。 例 
如 ， 对 于 图 9.6(a) 的 数据 文件 ， 主 关键 字 是 职工 号 ， 排 序 前 的 索引 表 如 图 9.6《〈c) 所 示 ， 
排序 后 的 索引 表 见 图 9.6 (b)， 图 9.6 (a) 和 图 9.6 (b) 一 起 组 成 索引 文件 。 


职工 号 | 姓名 | 性 别 
04 1000 04 1000 | 
ml | [Lu la 
oj| 1 | | 0 | ao 
| 010 


8 | ao 
la | [Lo la 
20 | 1060 


(a) 文件 数据 区 (b) 索引 表 (c) 输入 过 程 中 建立 的 索引 表 
图 9.6 索引 非 顺序 文件 示例 


索引 文件 的 检索 方式 为 直接 存 取 或 按 关 键 子 存 取 。 整 个 过 程 分 两 步 进行 : 首先 三 找 过 


Xs 数据 结构 教程 与 题解 


引 表 ， 知 该 记录 在 表 上 存在 ， 则 根据 索引 项 指示 的 物理 位 置 到 外 存 上 谈 取 ; 否则 该 记录 不 
存在 。 在 找 索 引 表 时 ， 要 将 外 存 上 含有 索引 区 的 页 块 谈 入 内 存 。 在 外 存 上 庶 取 记录 时 ， 又 
要 将 含有 记录 的 页 块 谈 入 内 存 。 奋 索引 表 不 大 ， 则 可 将 索引 表 一 次 谈 入 内 存 ， 因 此 ， 去 引 
文件 的 检索 一 般 只 需 两 次 访问 外 存 : 一 次 谈 索 引 ， 一 次 谈 记 录 。 由 于 索引 表 是 有 序 的 ， 对 
索引 表 的 得 找 可 用 顺序 得 找 ， 也 可 用 二 分 得 找 等 方法 。 

注意 ， 如 条 只 再 知道 茶 个 记录 是 否 存 在 以 及 在 何 处 ， 并 不 要 大 正 将 它 谈 出 来 《这 种 情 
况 称 作 预 查找 )， 则 在 稠密 索引 表 中 残 可 完成 ， 此 时 只 需 一 次 访 外 。 黎 焉 守 引 表 不 能 进行 预 
得 找 ， 但 它 占 用 的 空间 少 。 

索引 文件 的 修改 比较 容易 实现 。 删 除 一 个 记录 仅 需 删 去 相应 的 索引 项 ， 插 入 一 个 记录 
时 ， 将 记录 置 于 数据 区 的 末尾 ， 同 时 在 索引 表 中 插入 索引 项 ， 更 新 记录 时 ， 应 将 更 新 后 的 
记录 置 于 数据 区 的 末尾 ， 同 时 修改 索引 表 中 相应 的 索引 项 。 

当 文 件 中 记录 数目 很 大 时 ， 索 引 表 也 很 大 ， 以 致 一 个 物理 页 块 容 纳 不 下 。 这 时 得 阅 索 
引 仍 要 多 次 访问 外 存 。 为 此 ， 可 以 对 索引 表 上 再建 立 一 个 索引 ， 称 为 查找 表 。 因 为 索引 表 古 
有 序 的 ， 查找 表 可 进行 分 块 案 引 (稀疏 索引 )， 如 对 每 个 物理 块 建 一 个 索引 。 这 时 索引 文件 
的 检索 要 3 次 访 外 : 会 找 表 一 索引 表 一 数据 文件 。 如 果 僵 找 表 还 很 大 ， 可 再 对 其 建 案 引 ， 
依次 类 推 ， 即 进行 多 级 索引 。 通 肖 最 局 可 达 四 级 索引 : 第 三 得 找 表 一 第 二 得 找 表 一 奏 找 
表 一 索引 表 一 数据 文件 。 检 索 过 程 从 最 局 一 级 索引 即 第 三 得 找 表 开始 ， 需 要 5 次 访 外 。 

上 述 多 级 索引 是 一 种 静态 索引 ， 各 级 索引 均 为 顺序 表 ， 结 构 何 单 ， 但 修改 很 不 方便 ， 
每 次 修改 部 要 重组 索引 。 因 此 ， 当 数据 文件 在 使 用 过 程 中 记录 变动 较 多 时 ， 应 采用 动态 过 
引 ， 例 如 二 又 排序 树 〈 或 AVL 树 )、B 树 (或 其 变型 )， 这 些 都 是 树 表 结构 ， 插 入 、 删 除 都 
很 方便 。 叉 由 于 它们 本 喘 是 层次 结构 , 因而 实际 上 无 须 建立 多 级 索引 , 而且 建 立 索 引 表 〈 树 
表 ) 的 过 程 即 相当 于 排序 过 程 。 通 常 ， 当 数据 文件 的 记录 数 不 很 多 ， 内 存 容量 是 以 容纳 整 
个 索引 表 时 ， 可 采用 二 又 排序 树 〈 或 AVL 树 ) 作 索 引 ; 当 文 件 很 大 时 ， 索引 表 〈 树 表 ) 本 
吴 也 在 外 存 ， 则 得 找 索引 时 需 多 次 访问 外 存 ， 并 且 访 问 外 存 的 次 数 恰好 为 查找 路 径 上 的 结 
点 数 。 显 然 ， 为 减少 访问 外 存 的 次 数 ， 就 应 尽量 缩减 索引 表 的 深度 。 此 时 可 采用 mm 叉 的 也 
树 (或 其 变型 ) 作 索引 表 ，m 的 选择 取决 于 索引 项 的 多 少 和 缓冲 区 的 大 小 。 

恕 之 ， 因 为 访问 外 存 的 时 间 比 内 存 中 得 找 的 时 间 大 得 多 ， 押 以 ， 评 价 外 存 中 索引 表 的 
但 找 性 能 ， 主 要 独眼 于 访问 外 存 的 次 数 ， 即 索引 表 的 深度 。 注 总， 索引 文件 只 能 是 磁盘 文 
件 ， 因 为 索引 文件 的 组 织 方式 是 为 随机 存 取 而 设计 的 ， 而 磁 剖 的 随机 存 取 效 率 很 低 。 
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上 节 介 绍 的 索引 非 顺 序 文件 适合 于 随机 存 取 , 不 适合 顺序 存 取 。 因为 主 文件 是 无 序 的 ， 
顺序 存 取 将 引起 磁头 的 频繁 移动 。 但 索引 顺序 文件 的 主 文件 是 有 序 的 ， 它 既 适 合 于 随机 存 
取 ， 也 适合 于 顺序 存 取 。 另 外 ， 索 引 非 顺序 文件 的 索引 是 稠密 索引 ， 而 索引 顺序 文件 的 索 
引 是 稀 玻 索引 ， 后 者 占用 的 空间 较 少 。 因 此 ， 和 常 用 的 文件 组 织 形式 是 索引 顺序 文件 。 本 节 
介绍 两 种 最 常用 的 索引 顺序 文件 : ISAM 文件 和 VSAM 文件 。 
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9.4.1 1ISAM 文件 


ISAM (Indexed Sequential Access Method: 索引 顺序 存 取 方法 ) 是 一 种 专 为 磅 盘存 取 
文件 设计 的 文件 组 织 方式 , 采用 静态 索引 结构 。 在 采用 了 B 树 之 前 , IBM 曾经 广泛 地 使 用 它 。 
由 于 人 厂 盘 是 以 熏 组 、 柱 面 和 磁道 三 级 地 址 存 取 的 设备 , 则 可 对 磁盘 上 的 数据 文件 建立 熏 组 、 
柱 面 和 磁道 多 级 索引 ， 下 面具 讨论 在 同一 个 盘 组 上 建立 的 ISAM 文件 。 

ISAM 文件 由 多 级 主 索引 、 柱 面 索引 、 磁 道 索 引 和 主 文件 组 成 。 为 了 提高 访问 效率 ， 
文件 的 记录 在 同一 盘 组 上 存放 时 ， 应 尽量 先 集 中 放 在 同一 个 柱 面 上 ， 然 后 再 顺序 存放 在 相 
邻 的 柱 面 上 。 对 同一 柱 面 ， 则 应 按 盘 面 的 次 序 顺序 存放 。 例 如 图 9.7 所 示 为 存放 在 同一 个 
厂 盘 上 的 一 个 ISAM 文件 ， 其 中 C 表示 柱 面 ，T 表示 磁道 (图 中 每 个 磁道 存放 4 条 记录 )， 
CiTi 表示 工 号 柱 面 ] 号 磁道 ，Ri 表 示 关 键 字 为 1 的 记录 。 
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了 
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图 9.7 ISAM 文件 结构 示例 


图 9.7 的 文件 只 有 一 级 主 索 引 ， 它 是 柱 面 索引 的 索引 。 如 果 柱 和 面 罕 引 很 大 ， 使 得 主 索 
引 也 很 大 时 ， 可 对 主 索 引 再 建 案 引 ， 组 成 多 级 主 索 引 。 当 然 ， 如 果 柱 面 索 引 较 小 ， 主 索引 
也 可 省 略 。 通 常 主 索引 和 柱 面 索引 放 在 同一 个 柱 和 面 上 图 9.7 中 放 在 0 号 柱 面 ， 但 为 了 减 
少 磁 头 在 柱 面 间 的 来 回 移动 量 , 放 在 文件 中 间 位 置 的 柱 面 较 好 ), 主 索 引 放 在 该 柱 面 最 前 的 
一 个 磁道 fg 上， 其 后 的 磁道 中 存放 柱 面 索引 。 

每 个 存放 主 文件 的 柱 面 都 建立 一 个 磁道 索引 ， 放 在 该 柱 面 最 前 面 的 磁道 Te 上 ,其 后 的 
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耕 干 个 磁道 是 存放 主 文件 + 的 基本 区 ， 该 柱 和 面 最 后 的 大 和 干 个 人 磁 志 是 柱 面 洲 出 区 (大 柱 面 洲 
出 区 不 足 ， 还 可 设置 一 个 公共 溢出 区 )。 基 本 区 中 的 记录 按 关 键 字 的 大 小 顺序 存储 ， 溢 出 区 
被 该 柱 面 上 基本 区 中 的 各 磁道 共 圣 ， 当 基本 区 中 系 磁道 游 出 时 ， 就 将 其 洲 出 记录 ， 按 主 关 
键 字 大 小 链 成 一 个 链表 〈 以 下 简称 溢出 链表 )， 放 入 溢出 区 。 

各 级 索引 中 的 索引 项 结构 ， 如 图 9.8 所 示 ， 其 中 ， 每 个 磁道 索引 的 索引 项 由 两 个 部 分 
组 成 :基本 索引 项 和 洲 出 索引 项 。 


主 索引 项 : | 本 组 柱 面 索引 项 中 最 大 关键 字 | 本 组 柱 面 索引 项 的 起 始 地 址 
柱 面 索引 项 : 本 柱 面 的 最 大 关键 字 本 柱 面 的 磁道 索引 地 址 
磁道 索引 项 : | 本 道 最 大 关键 字 | 本 道 起 始 地 址 | 本 道 滋 出 链表 的 最 大 关键 字 | 本 道 溢出 链表 的 头 指针 


基本 索引 项 | 溢出 索引 项 | 


图 9.8 各 级 索引 项 格式 


在 ISAM 文件 上 检索 记录 时 ， 先 从 主 索 引出 发 ， 找 到 相应 的 柱 面 索引 ， 绸 从 柱 面 索引 
找到 记录 所 在 柱 面 的 磁道 索引 ， 通 过 其 基本 索引 项 或 溢出 索引 项 ， 找 到 记录 所 在 磁道 的 起 
始 地 址 或 溢出 链表 的 头 指 针 ， 由 此 出 发 ， 在 该 磁道 上 或 溢出 区 中 进行 顺序 得 找 ， 直 到 找到 
或 找 遇 为 止 。 右 找 过 该 磁道 或 溢出 区 都 没有 找到 此 记录 ， 则 文件 中 无 此 记录 。 

例如 ， 要 在 图 9.7 中 查找 记录 Rize， 先 查 主 索引 ， 即 读 入 CoTo， 因 为 129<270， 则 碍 
找 柱 面 索 引 的 CoT1， 即 读 入 CoTi， 因 为 120<129<180， 上 所 以 ， 进 一 步 把 CzTo 谈 入 内 存 ， 
但 磁道 索引 ， 因 为 129<131， 所 以 ，C2Ti 即 为 Rize 所 存放 的 磁道 ， 谈 入 C2zTi 后 即 可 奏 得 
Rize。 大 找 Ri3o， 过 程 类 似 ， 但 最 后 找 壳 该 磁道 都 没有 ， 则 文件 中 无 Riao。 

为 了 提 局 检索 效率 ， 通 稼 可 让 主 索 引 弟 驻 内 存 ， 并 将 柱 面 索引 放 在 数据 文件 所 占 空 间 
居中 位 置 的 柱 面 上 ， 这 样 ， 从 柱 面 索引 得 找 磁 道 索 引 时 ， 磁 头 移动 距离 的 平均 值 最 小 。 

当 插入 新 记录 时 ， 由 于 记录 要 按 关 键 字 顺 序 存放 ， 这 时 需 移 动 记录 。 首 先 找 到 应 插入 
的 磁道 ， 才 该 磁道 已 满 ， 则 磁道 上 最 末 一 个 记录 移 人 至 溢出 区 ， 同 时 修改 磁道 索引 的 基本 索 
引 项 和 溢出 索引 项 。 例 如 ， 将 记录 R36 插入 到 图 9.7 的 文件 ， 它 应 插 在 Cl 柱 面 Ti 磁道 上 ， 
结果 该 人 磁道 上 最 后 一 个 记录 Reo 被 移入 溢出 区 。 此 时 该 磁道 上 最 大 关键 字 由 60 变 成 了 48， 
同时 洲 出 链表 也 由 空 变 为 含有 一 个 记录 Reo 的 表 。 因 此 ， 将 CiTo 对 应 的 磁道 索引 项 中 基本 
索引 项 的 最 大 关键 字 ， 由 60 改 为 48; 将 洲 出 索引 项 的 最 大 关键 字 置 为 60， 且 令 洲 出 链表 
头 指 针 指 癌 Reo 的 位 置 。 类 似 地 ， 如 果 再 插入 Res 和 R77， 则 Ci 柱 面 T 磁道 上 的 Rez 和 R83 
馈 先 后 移 到 洲 出 区 ， 即 该 磁道 的 洲 出 链表 上 有 两 个 记录 。 于 是 也 要 分 别 修 改 人 磁道 索引 中 相 
应 的 基本 索引 和 溢出 索引 ， 最 后 结果 见 图 9.9。 注 意 溢出 索引 指针 指向 Rss， 而 Rss 又 指向 
Rsrz， 这 是 为 了 保证 滋 出 链表 按 关 键 字 有 序 。 

ISAM 文件 中 删除 记录 的 操作 ， 比 插入 稍 单 得 多 ， 只 要 找到 竺 删除 的 记录 ， 在 其 存储 
位 置 上 作 删 除 标 记 即 可 ， 而 不 需要 移动 记录 或 改变 指针 。 在 经 过 多 次 的 增删 后 ， 文 件 的 结 
构 可 能 变 得 很 不 合理 。 此 时 ， 大 量 的 记录 进入 滋 出 区 ， 而 基本 区 中 又 当 费 很 多 空间 。 因 此 ， 
通常 需要 定期 地 整理 ISAM 文件 ， 把 记录 读 入 内 存 ， 重 新 排列 ， 再 复制 成 一 个 新 的 ISAM 
文件 ， 填 满 基 本 区 .而 空 出 溢出 区 。 
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9.9 插入 R36、 R6s、 R77 后 的 状况 


9.4.2 VSAM 文件 


VSAM (Virtual Storage Access Method， 虚 拟 存 储存 取 方 法 )， 也 是 一 种 索引 顺序 文件 
的 组 织 方式 ， 采 用 B 树 作为 动态 索引 结构 。 之 所 以 称 其 为 “虚拟 存 取 ”， 是 指 对 用 户 来 说 ， 
存储 单位 是 “网 辑 ” 的 《〈 即 下 述 控制 区 间 和 控制 区 域 )， 与 存储 设备 无 关 《〈 与 柱 面 、 磁 道 等 
物理 存储 单位 没有 必然 的 联系 )。 例 如， 可 以 在 一 个 磁道 中 放 n 个 控制 区 间 ， 也 可 以 一 个 控 
制 区 间 路 nm 个 磁道 ; 在 具体 存 取 茶 个 记录 时 ， 不 再 要 考虑 该 记录 当前 是 合 在 内 存 ， 也 不 再 
要 考虑 何 时 访 外 。IBM 公司 VSAM 文件 是 用 B 树 作为 文件 的 稀疏 索引 的 一 个 典型 例子 ， 
它 使 用 了 IBM 370 系列 的 操作 系统 的 分 页 功能 ， 存 取 方 法 与 存储 设备 无 关 。 

如 果 B 树 中 每 个 叶 结 点 中 的 关键 字 对 应 一 个 记录 ， 则 适宜 于 作 稠 密 索引 。 若 让 叶 结 点 
中 的 关键 字 对 应 一 个 页 块 ， 则 B- 树 可 用 来 作为 稀 玻 索 引 。VSAM 文件 的 结构 如 图 9.10 所 
示 。 它 由 三 部 分 组 成 : 索引 集 、 顺 序 集 和 数据 集 。 文 件 的 记录 均 存 放 在 数据 集中 ， 数 据 集 


中 的 一 个 结 点 称 为 控制 区 间 (Control Interval)， 它 是 一 个 IO 操作 的 基本 单位 ， 每 个 控制 
区 间 含 有 一 个 或 多 个 按 关 键 字 递增 排列 的 记录 ， 同 一 文件 上 的 控制 区 间 的 大 小 相同 。 
py root 随机 查找 


控制 区 域 。 控制 区 间 


9.10 ”VSAM 文件 的 结构 示意 图 


索引 集 和 顺序 集 一 起 构成 一 棵 B 树 , 它 是 文件 的 索引 部 分 。 顺序 集中 存放 每 个 控制 区 
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间 的 索引 项 ， 由 两 部 分 信息 组 成 ， 即 该 控制 区 间 中 的 最 大 关键 字 和 指 问 控制 区 间 的 指针 。 
ep 形成 顺序 集中 的 一 个 结 点 ， 结 点 之 加 用 指针 相 链 接 ， 而 每 

结 点 又 在 其 上 一 层 的 结 点 中 建 有 索引 ， 且 逐 层 同上 建立 索引 ， 所 有 的 索引 项 都 由 最 大 关 
键 字 和 指针 两 部 分 信 息 组 成 这 些 高 层 的 索引 项 形成 B 树 的 非 终端 结 点 。 顺 序 集中 一 个 结 
点 连同 其 对 应 的 所 有 控制 区 间 形 成 一 个 整体 ， 称 做 控制 区 域 on Range)。 每 个 控制 区 
域 可 视 为 一 个 逻辑 柱 面 ， 而 控制 区 间 可 视 为 一 个 逻辑 人 磁 志 。 

因此 ，VSAM 文件 既 可 在 顺序 集中 进行 顺序 存 取 ， 又 可 从 最 高 层 的 索引 (B 树 的 根 结 
点 ) 出 发 ， 按 关键 学 存 取 。 

在 VSAM 文件 中 , 记录 可 以 是 不 定 长 的 , 因而 在 控制 区 间 中 , 除了 存放 记录 本 喘 之 外 ， 
还 有 每 个 记录 的 控制 信息 和 整个 区 间 的 控制 信息 (如 区 间 中 存放 的 记录 数 等 ), 控制 区 间 的 
结构 如 图 9.11 所 示 。 


记录 人 | 记录 2 | … | 记录 n | 记录 的 控制 信息 | 控制 区 间 的 控制 信息 


图 9.11 控制 区 间 的 结构 示例 


VSAM 文件 中 没有 溢出 区 ， 解 决 插入 的 方法 是 在 初 建文 件 时 留 出 空间 : 一 是 每 个 控制 
区 间 内 并 未 填 满 记录 ， 而 是 在 最 末 一 个 记录 和 控制 信息 之 间 留 有 空 际 ; 二 是 在 每 个 控制 区 
域 中 有 一 些 完 全 衬 的 控制 区 间 ， 并 在 顺序 集 的 索引 中 指明 这 些 空 区 间 。 可 见 ，VSAM 文件 
占用 较 多 的 存储 空间 ， 一 般 只 能 保持 平均 7$% 的 存储 空间 利用 率 。 

当 插 入 新 记录 时 ， 大 多 数 的 新 记录 能 插入 到 相应 的 控制 区 间 内 ， 但 要 注意 : 为 了 保持 
区 则 内 记录 的 关键 字 从 小 至 大 有 序 ， 则 需 将 区 间 内 比 每 插 记 录 关 键 字 大 的 记录 ， 同 控制 信 
息 的 方向 移动 。 若 控制 区 间 己 满 ， 则 在 下 一 个 记录 插入 时 ， 要 进行 控制 区 间 的 分 裂 ， 即 把 
近乎 一 半 的 记录 移 到 同一 控制 区 域内 全 空 的 控制 区 间 中 ， 并 修改 顺序 集中 相应 索引 。 倘 知 
控制 区 域 中 已 经 没有 全 衬 的 控制 区 间 ， 则 要 进行 控制 区 域 的 分 裂 ， 此 时 ， 顺 序 集 中 的 结 点 
亦 要 分 裂 ， 由 此 尚 需 修改 索引 集中 的 结 点 信息 。 但 由 于 控制 区 域 较 大 ， 通 党 很 少 发 生 分 裂 
的 情况 。 

在 VSAM 文件 中 删除 记录 时 , 需 将 同一 控制 区 间 中 比 竺 删 记 录 关 键 字 大 的 记录 问 前 移 
动 ， 把 衬 间 留 给 以 后 插入 的 新 记录 。 帮 整个 控制 区 间 变 空 ， 则 回收 作 空 亲 区 间 用 ， 且 需 删 
除 顺 序 集中 相应 的 索引 项 。 

和 ISAM 文件 相 比 ， 基 于 B' 树 的 VSAM 文件 有 如 下 优点 ; 能 保持 较 高 的 查找 效率 ， 
查找 一 个 后 来 插入 的 记录 和 查找 一 个 原 有 记录 具有 相同 的 速度 ; 动态 地 分 配 和 释放 存储 空 
间 ; 永远 不 必 对 文件 进行 再 组 织 。 因 而 基于 B 树 的 VSAM 文件 ， 通常 被 作为 大 型 索引 顺 
序 文 件 的 标准 组 织 。 


外 5、 散 列 文件 


获 列 文件 是 利用 敌 列 技术 组 织 的 文件 ， 亦 称 直接 存 取 文 件 。 它 类 似 于 散 列 表 ， 即 根据 
文件 中 关键 字 的 特点 , 设计 一 个 敌 列 函数 和 处 理 冲突 的 方法 , 将 记录 和 散 列 到 外 存储 设备 上 。 
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由 于 存储 介质 是 外 存储 器 , 散 列 文件 中 的 记录 通常 是 成 组 存放 的 , 这 点 与 散 列 表 不 同 。 
若干 个 记录 组 成 一 个 存储 单位 ， 称 做 桶 (Bucket)。 假 如 一 个 桶 能 存放 m 个 记录 ， 则 m 个 
互 为 同义词 的 记录 可 以 存放 在 同一 地 址 的 桶 中 ， 当 第 m+l 个 同义词 出 现时 才 发 生 “ 滋 出 ”。 
处 理 湾 出 ， 也 可 采用 散 列 表 中 处 理 神 突 的 各 种 方法 ， 但 对 散 列 文件 ， 主 要 采用 拉链 法 。 

当 发 生 “ 洲 出 ”时 ， 需 要 将 第 mt+l 个 同义词 存放 到 另 一 个 桶 中 ， 通 常 称 此 桶 为 “溢出 
桶 ”相对 地 ， 称 前 m 个 同义词 存放 的 桶 为 “ 基 桶 ”。 溢出 桶 和 基 桶 大 小 相同 ， 相 互 之 间 用 
指针 链接 。 当 在 基 桶 中 没有 找到 待 查 记录 时 ， 就 沿 着 指针 到 所 指 的 洲 出 桶 中 进行 查找 。 
此 ， 和 希望 同一 散 列 地 址 的 溢出 桶 和 基 桶 ， 在 磁盘 上 的 物理 位 置 不 要 相距 太 远 ， 最 好 在 同一 
柱 面 上 。 

例如 , 某 文 件 有 14 个 记录 , 其 关键 字 序 列 为 {09, 19, 01, 14, 22, 25, 33, 27, 26, 05, 15, 18， 
29, 12}。 桶 的 容量 m=3， 桶 数 b=7， 用 除 余 法 作 散 列 函数 H(key)=key%7。 由 此 得 到 的 散 列 
og A 桶 编号 。 基 滋 出 本 

在 散 列 文件 中 进行 查找 时 ， 首 先 根据 给 定 值 求 出 散 
列 地 址 《〈 即 基 桶 号 )， 将 基 桶 的 记录 读 入 内 存 ， 进 行 顺 
序 查 找 , 知 找到 关键 字 等 于 给 定 值 的 记录 , 则 检索 成 功 。 
当 在 基 桶 内 碍 不 到 时 ， 若 基 桶 没有 填 满 ， 则 文件 中 不 含 
符 查 记录 ， 和 否则 根据 指针 域 的 值 找 到 溢出 桶 ， 并 将 其 中 
的 记录 读 入 内 存 继续 进行 顺序 查找 ， 直 至 查找 成 功 或 不 
成 功 。 图 9.12” 散 列 文件 示例 

在 散 列 文件 中 删除 一 个 记录 ， 仅 需 对 被 删 记 录 作 删 
除 标 记 即 可 。 

散 列 文件 的 优点 是 : 文件 随机 存放 ， 记 录 不 需 进 行 排序 ; 插入、 删除 方便 ; 存 取 速 度 
快 ; 不 需要 索引 区 ， 节 省 存储 空间 。 其 缺点 是 : 不 能 进行 顺序 存 取 ， 只 能 按 关键 字 随 机 存 
取 ， 且 查询 方式 限于 精确 查询 。 在 经 过 多 次 插入 、 删 除 后 ， 可 能 造成 文件 结构 不 合理 ， 如 
溢出 桶 满 而 基 桶 内 多 数 记 录 已 被 删除 ， 此 时 需要 重新 组 织 文件 。 


DO 上 wm 一口 


8.6， 多 关键 字 文 件 


行 东 些 碍 询 。 例 如 图 9.1 的 职工 档案 文件 ， 职 工 号 为 主 关 键 字 ， 姓 名 、 人 性别、 年 龄 等 为 次 
关键 字 。 对 该 文件 可 能 要 进行 如 下 查询 : 找 25 岁 的 男 职 工 。 这 涉及 性 别 (=“ 男 ”) 和 年 
瞧 (=25) 两 个 次 关键 学 。 如 果 文 件 组 织 中 只 有 主 关 键 学 索引 ， 则 这 类 查询 只 能 顺序 存 取 
文件 中 的 每 一 条 记录 进行 比较 ， 效 率 很 低 。 为 此 ， 除 了 按 以 上 几 市 讨论 的 方法 组 织 文 件 之 
外 ， 还 需 建 立 一 系列 的 次 关键 字 索 引 〈 但 次 关键 字 相 同 的 记录 一 般 有 多 条 )。 这 种 包含 有 大 
干 次 关键 字 索 引 的 文件 称 为 多 关键 字 文 件 。 次 关键 子 索引 可 以 是 稠密 的 , 也 可 以 是 黎 惑 的 ; 
索引 表 可 以 是 顺序 表 ， 也 可 以 是 树 表 。 
下 面 讨 论 两 种 多 关键 字 文 件 的 组 织 方法 。 


“x 


数据 结构 教程 与 题解 


9.6.1 多 重 表 文件 


多 重 表 文件 (Multilist File) 是 将 索引 方法 和 链接 方法 相 结合 的 一 种 组 织 方式 : 将 相同 
次 关键 字 的 记录 构成 链表 ;分别 对 主 关 键 字 和 需要 查询 的 次 关键 字 建 立 主 索 引 和 次 索引 ; 
次 索引 指 癌 次 关键 字 链 表 ， 其 索引 项 由 该 链表 的 头 指 针 、 链 表 长 度 及 次 关键 字 组 成 。 其 中 
次 关键 字 链 表 并 不 单独 建立 ， 而 是 通过 在 主 文件 中 增设 次 关键 字 指 针 字 段 来 实现 。 通 常 多 
重 表 文 件 的 主 文件 是 一 个 顺序 有 序 文件 ， 从 而 主 索引 可 建 为 稀 朴 索引 ， 但 次 索引 是 稠密 
索引 。 

注意 ， 头 指针 和 链 指针 可 以 是 记录 的 实际 物理 地 址 ， 也 可 以 是 记录 号 ， 甚 至 还 可 以 是 
主 关键 字 。 因 为 主 关键 字 可 看 成 是 记录 的 符号 地 址 ， 但 这 样 的 索引 表 存 取 速 度 较 慢 ， 优 点 
是 对 于 存储 具有 相对 独立 性 。 为 简单 起 见 ， 本 节 以 下 将 索引 链 取 为 记录 号 。 

例如 图 9.13 是 一 个 多 重 表 文件 的 示例 。 主 关键 字 是 职工 号 , 次 关键 字 取 为 性 别 和 年 龄 。 
它 设 有 两 个 链接 字段 ， 分 别 将 具有 相同 性 别 和 相同 年 龄 的 记录 链 在 一 起 ， 由 此 形成 的 性 别 
索引 和 年 龄 索引 见 图 9.13 (c) 和 图 9.13 〈d)。 


(b) 主 索 引 (c)“ 性 别 ” 次 索引 (d)“ 年 龄 ”次 索引 
图 9.13 多 重 表 文件 示例 


有 了 这 些 索 引 ， 便 易于 处 理 各 种 有 关 次 关键 了 学 的 合 询 。 例 如 ， 要 僵 询 所 有 田 职 工 ， 则 
只 需 在 性 别 罕 引 中 先 找 到 次 关键 子 “ 田 ”的 索引 项 ， 然 后 从 它 的 头 指 针 01 出 友 ， 拷 到 01 
写 记 录 ， 从 该 记录 的 性 别 链 中 得 到 下 一 个 是 03 写 记 录 等 ,可 列 出 该 链表 上 所 有 的 记录 。 如 
果 是 组 合 合 询 ， 如 找 25 岁 的 男 职工 ， 则 既 可 以 从 性 别 罕 引 中 “ 田 ” 的 头 指 针 出 发 ， 也 可 以 
从 年 龄 索引 中 “21 一 30” 的 头 指 针 出 发 ， 谈 出 相应 链表 上 的 每 个 记录 ， 判 定 它 是 否 满足 得 
询 条 件 。 对 这 种 情况 ， 还 可 先 比 较 这 两 个 链表 的 长 度 ， 然 后 在 较 短 的 链表 上 得 找 ， 可 提高 
但 找 效 率 。 

在 上 例 中 ， 各 个 次 关键 子 链 表 是 按 主 关键 子 大 小 链接 的 。 如 朱 不 要 求 你 持 链 表 的 大 种 
次 序 ， 则 插入 一 个 新 记录 是 容易 的 ， 此 时 可 将 记录 插 在 链表 的 头 指 针 之 后 。 但 是 ， 要 删 去 
一 个 记录 却 很 烦琐 ， 需 要 在 每 个 次 关键 子 的 链表 中 搜索 并 删 去 该 记录 。 
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9.6.2 倒 排 文件 


倒 排 文件 和 多 重 表 文件 类 似 ， 区 别 在 于 次 关键 字 索 引 的 结构 不 同 。 倒 排 文 件 中 的 次 关 
键 字 索引 称 做 倒 排 表 。 具有 相同 次 关键 学 的 记录 之 间 不 进行 链接 , 而 是 将 它们 的 记录 号 (或 
物理 地 址 ) 直接 列 在 索引 表 中 。 例如 ， 对 表 9.13 所 示 的 多 重 表 文 件 ， 去掉 两 个 链接 字段 后 ， 
所 建立 的 性 别 倒 排 表 和 年 龄 倒 排 表 ， 如 图 9.14 (a) 和 图 9.14 (b) 所 示 。 倒 排 表 和 主 文件 
一 起 就 构成 了 倒 排 文件 (Inverted File)。 


男 | 01.03.06 
妇 01. 03 
(a) “性别” 倒 排 表 Cb) “年 龄 ” 倒 排 表 


图 9.14 倒 排 文 件 索 引 示例 


在 图 9.14 的 倒 排 表 中 ， 各 索引 项 的 记录 号 是 有 序 的 。 如 宁 主 文件 是 无 序 的 ， 则 记录 号 
有 序 并 不 意味 看 主 关 键 字 有 序 。 这 时 ， 还 可 以 将 这 些 记录 号 按 主 关键 字 有 序 排列 。 

倒 排 表 的 主要 优点 是 得 找 速度 较 快 : 在 处 理 复杂 的 多 关键 字 答 询 时 ， 可 先 在 倒 排 表 中 
完成 得 询 〈 预 查询 ， 包 括 碍 询 条 件 的 交 、 并 等 多 辑 运 算 )， 得 到 结 琳 后 册 对 记录 进行 存 取 。 
这 样 不 必 对 每 个 记录 都 随机 存 取 ， 而 把 对 记录 的 得 询 转换 为 记录 号 〈 或 地 址 ) 集合 的 运算 ， 
从 而 提高 但 找 速 度 。 例 如 ， 要 找 出 所 有 年 龄 在 21 一 30 岁 的 男 职工 ， 则 先 对 年 龄 为 21 一 30 
的 记录 集 {02, 04, 05, 06} 与 性 别 为 男 的 记录 集 {01, 03, 06} 做 “ 交 ” 运 算得 到 {06}， 即 符合 条 
件 的 记录 为 06 号 记录 。 

在 插入 和 删除 记录 时 ， 需 要 修改 倒 排 表 。 

在 一 般 的 文件 组 织 中 ， 是 先 找 记录 ， 然 后 册 找 到 该 记录 所 含 的 各 次 关键 子 ， 而 倒 排 文 
件 中 ， 是 先 给 定 次 关键 字 ， 然 后 得 找 含有 该 次 关键 字 的 各 个 记录 ， 这 种 文件 的 得 找 次 序 正 
好 与 一 般 文 件 的 碍 找 次 序 相 反 ， 因 此 称 之 为 “ 倒 排 ” 由 此 可 见 ， 多 重 表 文件 实际 上 也 是 倒 
排 文 件 ， 只 不 过 索引 的 方法 不 同 。 


习 题 九 


9.1 什么 是 文件 的 逻辑 记录 和 物理 记录 ?它们 有 什么 区 别 与 联系 ? 

9.2 简 述 磁带 和 磁盘 的 结构 和 存储 信息 的 特点 。 

9.3 位 述 ISAM 文件 的 组 织 方 法 和 操作 特点 。 

9.4 简 述 散 列 文件 的 查找 方法 及 优 缺 点 。 

9.5 叙述 在 图 9.10 所 示 VSAM 文件 B 树 部 分 查找 键 值 为 80 的 记录 的 过 程 。 

9.6 文件 的 组 织 方法 与 外 存储 器 的 物理 特性 之 间 有 何 联系 ? 试 举例 说 明 。 

9.7 文件 的 操作 与 对 内 存 中 数据 的 操作 有 何不 同 ? 试 举例 说 明 。 

9.8 在 图 9.12 所 示 的 散 列 文件 中 , 若 还 有 两 个 键 值 分 别 为 39、54 的 记录 , 如 何 存放 ? 
9.9 文件 的 检索 效率 取决 于 哪些 因素 ? 
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1.1 解 : 首先 ， 从 数据 结构 的 3 个 方面 来 看 ， 逆 辑 结 构 和 运算 与 计算 机 无 天 ， 它 们 构 
成 问题 的 数学 模型 ， 即 使 没有 计算 机 也 是 存在 的 。 其 次 ， 日 音 生 活 中 的 很 多 问题 ， 如 网 书 、 
档案 等 的 放置 和 查找 ， 电 话 号 码 、 字 典 等 的 组 织 和 查找 ， 家谱、 人 事 关 系 等 的 记录 和 查询 ， 
多 条 路 径 中 找 最 短 ， 多 件 事 情 的 先后 安排 等 ， 这 些 实际 上 都 是 数据 结构 问题 。 广 义 地 讲 ， 
如 果 将 人 看 成 计算 机 的 CPU、 客 观 空 间 看 成 计算 机 的 内 外 存 、 要 处 理 的 各 种 事情 看 成 数据 ， 
则 只 要 人 在 活动 ， 数 据 结 构 问 题 束 无 处 不 在 。 

算法 只 是 对 特定 问题 求解 步骤 的 摘 述 ， 有 其 实现 时 不 是 在 计算 机 上 进行 ， 比 如 手工 处 
理 ， 就 不 需要 转换 为 计算 机 程序 。 

1.2 略 

1.3 解 : 基本 存储 结构 虽然 只 有 4 种 ,但 可 由 它们 组 合 出 多 种 非 基 本 储存 结构 。 

1.4 解 : 计算 机 性 能 提 高 后 ， 有 原来 比较 困难 的 时 空 复杂 上 度 问 题 也 许 会 有 所 绥 和 ， 但 人 
们 往往 又 会 要 求 处 理 更 大 规模 和 更 加 复杂 的 问题 。 一 般 计 算 机 性 能 的 提高 总 难以 满足 大 规 
模 问 题 的 要 求 ， 并 且 问 题 的 规模 越 大 ， 程 序 的 效率 问题 就 越 突 出 。 另 外 ， 算 法 的 复杂 上 度 越 
高 ， 则 从 机 器 性 能 提高 上 得 到 的 收益 相对 就 越 小 。 

通过 算法 分 析 ， 可 以 在 编程 前 决定 菜 个 方案 是 人 否 可 行 ， 以 及 找到 效率 问题 的 关键 所 在 
和 改进 方 问 。 

1.5 解 : (2/3，21™，logyn, n,nlog,n, mn”, (3/27, 2°, nl, mm 

1.6 解 : 

(1) 循环 变量 i 的 取 值 为 二 1, 2, 3, …,k， 其 中 kn, 则 频 度 k 和 on, 复杂 度 为 On)。 

(2) 这 里 外 循环 次 数 形式 上 为 n， 但 内 循环 从 六 到 n， 则 外 循环 的 实际 有 效 循环 次 数 
为 Vn ， 故 内 循环 体 的 总 循环 次 数 是 


J/ 
六 o-P+D-=Vio+D- 冯 P Vt) -+ N+ oysy,) 


所 以 T(n)=O0(n ”7)。 
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1.7 解 : 
(1) 主要 程序 段 如 下 : 


sum=0; 
for (i=1;1i<=n;1++) 
sumt+=1; 
显然 该 程序 段 频 度 最 大 的 语句 是 循环 体 sum+=i， 它 执行 了 pn 次 ， 所 以 Tn)=O0n)。 
(2) 主要 程序 段 如 下 : 


sum=0; 

for (1=1;1<=n;1+=2) 

设 循环 体 的 执行 次 数 为 k， 则 最 后 一 个 奇数 为 2k-1， 即 有 2k-1 失 n， 所 以 k=O)， 从 
而 TD=Om)。 实 际 上 ， 注 意 到 nm 以 内 的 数 大 约 一 半 为 奇数 〈 男 一 半 左 右 为 偶数 )， 则 循环 
体 大 约 执行 M2 次 ， 也 可 得 到 T(n)=O(n)。 

(3) 主要 程序 段 如 下 : 


sum=0; 
for (1=1; sum<n; 1++) 
sumt+=1i-: 
if (sum>n) sum-= (i-1); // 最 后 一 次 累加 后 可 能 超过 了 n 


设 循环 体 的 执行 次 数 为 k， 则 sum=1+2+…+k=k(k+1)/2， 欲 使 som 三 n， 则 k=O)， 
所 以 T(n)=O(n"”)。 
1.8 解 : 主要 程序 段 如 下 : 


forti=sls1<=n:14=2) 
for (J=1;]j]<=1i;]J++) 


AL[i] [j]=0; 
这 里 虽然 外 循环 次 数 为 log,n ， 内 循环 次 数 为 1， 但 内 循环 体 的 总 循环 次 数 不 是 


log,n 
2_,1=1+2+3+…+logsn = (log,n)(logyn +1)/2， 因 为 外 循环 的 循环 变量 不 是 每 次 增 1 而 是 


1=1 


log n 

乘 2, 实际 执行 次 数 是 了 2* =1+2+22+…+2"8 一 2 2” -1=2n 一 1, 所 以 To)=O@)。 
k=0 

1.9 解 : 该 题 就 是 在 数组 A[n| 中 找 最 大 值 和 最 小 值 ， 显 然 其 比较 次 数 为 2(0-1) 次 。 如 


果 采 用 如 下 代码 ， 将 这 两 个 过 程 同 时 进行 : 
min=max=A[0]; 
for (1=1;1i<n;1++) 
if (A[i]<min) min=A[1i]; 
else if (A[i]>max) max=A[1]; 
则 最 好 情况 是 第 一 个 站 总 成 立 , 此 时 比较 次 数 降 为 np-1 次 ; 最 坏 情 况 是 第 一 个 站 总 不成立， 
第 二 个 站 总 要 执行 ， 比 较 次 数 为 2n-1) 次 。 
1.10 解 : 一 般 有 两 种 方法 : 
(1) 加 减法 : a+=b:b=a-b:a-=b: 
(2) 异 或 法 ，a=a^b:b=a^b:a=a^b: 
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第 2 章 线性 表 


2.1 解 : {a, b,c, d, ee, 人 表示 和 集合，(a, b, c, d, e, f) 表示 线性 表 。 
2.2 略 
2.3 略 
24 解 : 


(1) 这 时 顺序 表 的 类 型 定义 如 下 : 


typedef struct 1 


datatype *data; // 线 性 表 数 组 地 址 
int n; // 线 性 表 当 前 的 长 度 
} sqlist; 


除了 在 初始 化 时 要 分 配 数组 空间 外 ， 其 他 运算 的 算法 不 变 〈 略 )。 初 始 化 算法 如 下 : 


int init (sqlist *L) { 
L->data=new datatype [maxsizel]; 
if (L->data==NULL) {cout<<“ 内 存 不 足 !\n”;return 0;} 
L->n=0; / /修改 表 长 
return 1; // 初 始 化 成 功 
} 


另外 要 注意 ， 在 程序 结束 时 ， 要 释放 数组 空间 。 为 此 可 对 顺序 表 增 加 一 个 销毁 运算 : 
Vold destroy(sqlist *L) { 


delete[|]L->data; 
} 


(2) 这 时 顺序 表 的 类 型 定义 如 下 : 


typedef struct { 


datatype data[maxsize+l1]; // 线 性 表 数 组 空间 ，data[0] 不 用 
int n; // 线 性 表 当 前 的 长 度 
} sqlist; 


除了 初始 化 ， 其 他 运算 实现 时 注意 元 素 ai 对 应 的 位 置 为 datafi] 即 可 ， 只 体 复 法 略 。 
男 外 ， 也 可 用 data[0] 来 存放 数组 长 上 度 ， 这 时 顺序 表 的 类 型 定义 如 下 : 


typedef struct { 


datatype data[lmaxsize+l1]; // 线 性 表 数 组 空间 ，data[0] 存 放 线性 表 当 前 的 长 度 
} sqlist; 


有 天 算法 都 要 略 作 修 改 ， 有 具体 略 。 
2.5 解 : 
(1) 采用 课本 例 2.2 的 算法 ， 具 体 如 下 : 
Vold deletex(sqlist *L,datatype low,datatype high) { 

1 和 关 

Ss=0}; 

for (1=0;1i<L->n;1++) 

if (IL->data[i]>low && L->data[i]<high) s++; // 累 计 待 删 结 点 个 数 
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else if(s>0) L->data[i-s]=L->datal[il]; // 当 前 点 前 移 s 个 位 置 
L-—>n=L-—>n—s; // 调 整 表 长 
} 


(2) 注意 到 表 的 有 序 性 ， 先 找到 符 删 结 点 的 开始 位 置 ， 从 该 处 开始 累计 符 删 结 点 个 数 


s， 得 到 第 一 个 需要 前 移 的 结 点 ， 将 其 后 所 有 结 点 一 次 性 地 前 移 s 位 。 算 法 如 下 : 
void deletex(sqlist *L,datatype low,datatype high) { 
下 1 .3 
for (1i=0;1<L-—>n;1++) 
if (L->data[i]>low) break; // 得 到 符 删 结 点 的 开始 位 置 
S=0; 
for(;1i<L-—>n;1++) 
if (L->data[i]<high) st+t+; // 累 计 待 删 结 点 个 数 
else break; 
if(s==0) return; // 没 有 待 删 结 点 
FoOrt<ELnie DSdatali-sl=t-Sdatalil;: // 当 前 点 前 移 s 个 位 置 
L->n=L->n-—s; / /调整 表 长 
} 
2.6 解 : 


(1) 对 顺序 表 的 每 个 元 素 ， 删 除 其 后 值 与 之 相等 的 所 有 元 素 ， 这 可 采用 题 2.5 (1) 的 
方法 ， 算 法 如 下 : 


Vold purge (sqlist *A) { 
nt 1 二 


for (i=1;i<A-—>n;i++) { // 设 下 标 从 1 开始 使 用 
S=0 7; 
for (J=i+1;]<=A—>n;]J++) 
if (MS>datalijl A >datalil) s+; / /累计 重复 元 素 
else if(s>0) A->data[]j-s]=A->data[j]; // 前 移 s 个 位 置 
A->n=A->n-s; / /调整 表 长 


} 
} 


(2) 先 找 到 第 一 个 零 元 素 ， 然 后 删除 其 后 所 有 的 去 元 素 。 在 删除 零 元 素 时 ， 采 用 
题 2.5(1) 的 方法 ， 算 法 如 下 : 
Vold purge (sqlist *A) { 
Tm 了 
for (1=1; 1<=A—>n;1++) 


if (A->data[i]==0) break; // 找 第 一 个 零 元 素 ， 设 下 标 从 1 开始 使 用 


Ss=0; 
for (]=1I+17]J<=A->n7z]++) 

if (A->data[j]==0) s++; // 累 计 重 复 的 零 元 素 

else if(s>0) A->data[]j-s]=A->data[j];// 前 移 s 个 位 置 
A-—>n=A—>n—s; // 调 整 表 长 


} 


(3) 方法 1: 可 采用 题 2.$ (1) 的 方法 ， 算 法 略 。 
方法 2: 如 果 人 允许 改变 非 零 元 的 相对 位 置 ， 则 也 可 在 删除 零 元 素 时 ， 用 尾部 的 非 零 元 
素 与 其 交换 位 置 。 算 法 如 下 : 


Vold purge (sqlist *A) { 
a 
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I // 设 下 标 从 1 开始 使 用 
while(1<]) { 
while(i<] && A->data[i]!=0) i++; // 从 前 问 后 找 零 元 素 
while(i<] && A->data[]j]==0) JjJ-—-; // 从 后 回 前 找 非 去 元 素 
if(1<]) { 
A—->data[i]=A->data[j]; 
A->dqdata[]]=0:; 
I++7 一 一 ; 
} 
} 
if (A->data[i] !=0) A->n=i; // 调 整 表 长 
else A->n=1-1:; 


} 
2.7 解 : 
(1) 方法 1: 将 循环 右 移 一 位 的 过 程 执行 k 次 ， 主 要 语句 如 下 : 
for(1i=0;1i<k;1i++) { 
x=A[ln]; 
for (J]=n-17J>=17]--) A[J+1]=A[J]; 
A[l]=x; 
} 
总 移动 次 数 为 k(n+1)。 
方法 2: 逆 置 法 ， 问 题 的 要 求 相 当 于 将 数组 的 前 后 2 部 分 “交换 ”: AB->BA， 可 将 六 
后 2 段 分 别 逆 置 AB->A'B'"， 再 整体 逆 置 (AB"”) ->BA， 也 可 先 整体 逆 置 ， 再 前 后 两 段 分 
别 逆 置 。 主 要 语句 如 下 : 
for (1=1,]j=n-kzi<jzi++,j--) {x=A[i];A[i]=A[j];A[j]=x;} // 前 n-k 个 元 素 逆 置 
for (i=n—k+1, j=n;i<]j;i++, JjJ—-) {x=A[i];A[i]=A[j];A[j]=x;}// 后 个 元 素 逆 置 
for (i=1,j=n;i<j;i++,j-——) {Xx=A[i];A[i]=A[j];A[j]=x;} // 整 体 逆 置 
交换 次 数 为 Lan-kJ/2 Huw2 HLn/2j 和 nn， 总 移动 次 数 乏 3n。 
方法 3: 对 数组 后 k 个 元 素 中 的 每 个 ， 先 空 出 该 位 置 ， 再 依次 将 其 第 k 前 趋 ， 第 k 前 


趋 的 第 k 前 趋 ，…… ， 依 次 后 移 k 位 ， 奎 某 前 趋 为 最 初 空 出 的 位 置 ， 则 本 次 前 趋 搜 索 结 束 ， 
继续 处 理 下 一 个 元 素 ; 但 奎 总 的 元 素 调整 次 数 已 达 n， 则 结束 。 主 要 语句 如 下 : 
num=0 
for(i=n;i>n-—k;1i-—) { 
p=1; 
x=A[p]; // 空 出 初始 位 置 
for (q=p 的 上 前 趋 :gq!=i7zp=qydq=d 的 kx 前 趋 ) {A[p]=A[9q];num++;}// 累 计 已 处 理 元 素数 
A[p]=x;num++; // 累 计 已 处 理 元 素数 
if (num==n) break; 
} 


将 数组 空间 A[1..n| 看 成 循环 的 ， 则 1 单元 的 第 k 前 趋 为 -1-k+n)%n+1。 总 移动 次 数 最 
多 为 ntk， 最 少 ntl1( 空 出 初始 位 置 最 多 kk 次， 最少 1 次 )， 在 三 个 方法 中 是 最 少 的 。 

以 上 三 个 算法 隐 含 0 三 k<n。 辱 k=n， 则 算法 开始 时 应 加 上 一 句 k=k%n， 以 去 除 整 圈 
的 循环 移 位 〈 回 到 原始 位 置 )。 

(2) 相当 于 把 数组 AB 循环 右 移 m 位， 可 采用 (1) 题 的 各 种 方法 ， 略 。 

2.8 解 : 利用 有 序 性 ， 从 两 个 表 头 开始 逐个 比较 求 交 : 肴 当前 结 点 值 相同 则 取出 ， 否 
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则 结 点 值 小 的 后 移 ， 直 到 东 个 表 处 理 完 。 算 法 如 下 : 
(1) 以 顺序 表 为 存储 结构 


void and sq(sqlist *A,sqlist *B,sqlist *C) { 
40 1 1 
= // 设 下 标 从 1 开始 使 用 
k=0; 
while(i<=A-—>n && ]<=B->n) { 
1f (A->data[i]<B->data[j]]) i++; 
else if (A->data[il]>B->data[j]) J++; 


else { 
k++;C—>data[k]=A->data[1il]; 
工 + 二 7 二 十 7 
} 
} 
C->n=k; // 表 长 


} 
(2) 以 单 链 表 为 存储 结构 ( 设 链表 市 头 结 点 


lklist and lk(lklist A,1lklist B) 1 
pointer p,q,s,rear,c; 
C=new node; // 生 成 尖 结 点 
p=A—>next;q=B-—>next; rear=C; 
while(p!=NULL && qdq!=NULL) { 
If (p->data<qgq—->data) p=p->next; 
else 1if (p->data>q->data) q=q->next; 
else { 
s=new node; 
s->data=p->data; rear->next=s;rear=s; // 尾 捅 法 建 表 
p=p—>next;q=q—>next; 
} 
} 
rear—>next=NULL; // 表 尾 置 空 
return C; 


} 


2.9 解 : 该 题 与 例 2.5 相同 ， 可 参见 图 2.22， 在 链表 搜索 过 程 中 进行 结 点 的 判断 和 删 
除 。 搜 索 过 程 中 ， 随 时 记 住 当前 结 点 *p 的 前 趋 xq， 算 法 如 下 : 


vold deletex(lklist head,datatype low,datatype high) { 
pointer p,q; 
gq=head; 
while (p=q—>next,p!=NULL) 
if (p->data>low && p->data<high) { 
q—>next=p->next; 
delete p; 
} 
else { 
dps’ 
} 
} 


其 中 ， 每 次 p 取 新 值 的 语句 写 在 了 while 条 件 中 。 
2.10 解 : 合并 过 程 束 是 每 次 将 两 个 链表 当前 结 点 中 较 小 的 一 个 加 入 到 新 链表 ， 如 琳 东 
个 链表 先 处 理 完 ， 则 将 另 一 个 链表 的 剩 下 部 分 直接 加 入 到 新 链表 。 将 原 两 个 链表 头 结 点 之 
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一 作为 新 链表 的 头 结 点 ， 采 用 尾 插 法 建 表 。 
(1) 设 单 链表 有 头 结 点 ， 合 并 算法 如 下 : 


lklist merge (lklist A,1lklist B) { 
pointer p,q,rear; 
rear=A; // 取 头 结 点 A 作为 新 链表 的 头 结 点 
p=A—>next; q=B—>next; 
while(p!=NULL && qd!=NULL) 
if (p->data<q->data) { // 将 A 表 结 点 加 入 到 新 表 
rear—>next=p; rear=p; 
p=p—>next; 
} 
else 1{ 
rear—>next=q; rear=q; 
q=q—>next; 
} 
if (p!=NULL) rear->next=p; // 怕 及 链 表 还 有 剩 下 的 结 点 
1If(q9q!=NULL) rear—>next=q; // 原 B 链表 还 有 剩 下 的 结 点 
return A; 


} 
(2) 设 单 链 表 无 头 结 点 ， 合 并 算法 如 下 : 


lklist mergqe (lklist A,1lklist B) { 
pointer C,p,q,rear; 
if (A==NULL) return B; //A、B 链表 有 一 个 为 空 时 
if (B==NULL) return A; 
if (A->data<=B->data) {C=A;p=A->next;q=B; }//A、B 中 较 小 者 为 新 链表 C 的 首 结 点 


else {CBr7p-BA7 Bnezxts?) 
rear=C; 
while (p!=NULL && gq!=NULL) 
if (p->data<q->data) { // 将 A 链表 结 点 加 入 到 新 表 


rear—>next=p; rear=p; 
p=p—>next; 
} 
else { 
rear—>next=q; rear=q; 
q=q—>next; 
} 
if (p!=NULL) rear->next=p; //A、B 链表 之 一 还 有 剩 下 的 结 点 
1If(q9q!=NULL) Frear->nexXt=d7 
return C; 
} 


本 题 也 可 这 样 求解 : 以 两 个 链表 中 的 一 个 作 基 础 ， 将 另 一 个 链表 中 的 结 点 逐个 删除 并 
插入 进来 。 由 于 是 就 地 进行 ， 结 点 的 删除 和 插入 仅 对 有 关 指 针 重 新 进行 链接 。 算 法 略 。 
2.11 解 : 设 单 链表 有 头 结 点 。 
(1) 算法 思想 : 从 第 2 个 结 点 开始 判断 当前 结 点 是 售 比 其 前 趋 大 ， 算 法 如 下 : 
int detect (lklist L) { 
pointer p,q; //Pp 指 问 当前 结 点 ，9 为 其 前 趋 


p=L->next;if (p==NULL) return 1;  // 链 表 为 空 
while (q=p, p=p->next, p!=NULL) 
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if(p->data<q->data) return 0;  // 不 满足 递增 
return 1; 


} 


其 中 ， 问 后 推进 的 语句 写 在 了 while 条 件 中 。 
(2) 算法 思想 : 先 求 前 2 个 结 点 的 差 4， 然 后 从 第 3 个 结 点 开始 判断 当前 结 点 与 其 前 
1nt detect (Klist LL} 1 
pointer p,q; //Pp 指 当 前 结 点 ，9q 为 其 前 趋 
datatype dd; 
q=L->next;if(q==NULL) return 1;  // 链 表 为 空 
p=q->next;if(p==NULL) return 1;  // 链 表 只 有 1 个 结 点 
d=p->data-q->data; 
while (gq=p, p=p—>next,p!=NULL) 
if (p->data-q->data!=d) return 0;// 不 满足 等 差 
return 1; 


} 


(3) 算法 思想 : 先 求 前 2 个 结 点 的 比 4d， 然 后 从 第 3 个 结 点 开始 判断 当前 结 点 与 其 前 
趋 的 比 是 否 等 于 d。 算 法 与 上 题 类 似 ， 略 。 

2.12 解 : 设 多 项 式 用 循环 单 链表 表示 〈 设 其 中 各 结 点 按 指数 递减 排列 )。 多 项 式 相 加 
的 规则 是 ， 对 两 个 多 项 式 链表 的 当前 结 点 ， 如 果 指 数 相 同 ， 则 将 系数 相 加 ， 辱 该 系数 和 不 
为 0， 则 生成 新 多 项 式 链表 的 结 点 ; 如 果 指 数 不 同 ， 则 按 指数 较 大 的 项 生成 新 链表 的 结 点 ; 
如 果 某 个 多 项 式 先 处 理 完 ， 则 按 另 一 个 链表 的 剩余 部 分 逐个 生成 新 链表 的 结 点 。 设 相 加 的 
两 个 多 项 式 链 表 为 A 和 B， 非 形式 算法 如 下 : 


生成 新 链表 头 结 点 *C; 
新 链表 尾 指针 rear 指向 头 结 点 *C; feb 


用 p 和 9q 分别 指 问 多 项 式 链 表 A 和 B 的 首 结 点 ; 
while (A 链表 和 B 链表 都 没有 处 理 完 ) { 
if (当前 结 点 指数 相同 ) { 
计算 系数 和 x; 
if (x 不 为 零 ) {生成 新 结 点 ; 尾 插 到 新 链表 ; 按 x 赋值 新 结 点 ;A、B 当前 结 点 都 前 进一步 ;} 
} 
else { 
生成 新 结 点 ; 尾 插 到 新 链表 ; 
if (A 结 点 指数 大 于 B 结 点 ) { 按 *p 赋值 新 结 点 ;A 当前 结 点 前 进一步 ;} 
else { 按 *q 赋值 新 结 点 ;B 当前 结 点 前 进一步 ; } 
} 
} 
whlle (A 链表 没有 处 理 完 ) { 
生成 新 结 点 ; 尾 插 到 新 链表 ; 
按 #p 赋值 新 结 点 ;A 当前 结 点 前 进一步 ; 
} 
while (B 链表 没有 处 理 完 ) { 
生成 新 结 点 ; 尾 插 到 新 链表 ; 
按 #q 赋值 新 结 点 ;B 当前 结 点 前 进一步 ; 
} 
新 链表 尾 结 点 后 继 指 癌 头 结 点 ; // 使 成 循环 链表 
返回 新 链表 头 指 针 C; 
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依据 该 算法 就 不 难 写 出 具体 的 C/C++ 语 言 算法 了 , 如 判断 A 链表 是 否 处 理 完 的 条 件 为 
p!I-=A，A 链表 当前 结 点 前 进一步 的 语句 为 p=p->next 等 ， 共 体 算 法 略 。 


第 3 章 栈 、 队 列 和 串 


3.1 解 : 由 出 栈 序列 模拟 进出 栈 过 程 ， 可 知 其 间 栈 内 最 多 同时 有 3 个 元 素 ， 故 栈 的 容 
量 全 少 为 3。 

Ey 

(1) 证 : 这 是 显然 的 : i，j, 依次 入 栈 ， 但 最 先 出 栈 ， 则 它 之 前 入 栈 的 1 和 j 还 在 
栈 中 ， 当 kk 出 栈 后 ， 因 j 比 1 更 靠近 栈 项 ， 以 后 j 应 比 i 先 出 栈 。 

(2) 证 一 : 考察 第 1 个 入 栈 数据 “1”， 它 在 以 后 可 能 是 第 1、2、…、n 个 出 栈 。 不 妨 
设 为 第 i 个 出 栈 ， 则 其 后 的 亡 1 个 数 “2”“3” …、“i” 要 完成 进出 栈 后 它 才 可 出 栈 ; 而 
它 出 栈 后 ， 剩 下 的 mi 个 数 “i1” 一 “n” 也 要 完成 进出 栈 。 设 n 个 结 点 的 出 栈 序列 数 为 
ba， 则 前 二 1 个 数 的 出 栈 序列 数 为 bi1， 后 ni 个 数 的 出 栈 序列 数 为 bso;， 故 “1” 为 第 i 个 
出 栈 的 出 栈 序 列 数 为 biibni。 但 1 可 以 是 入 2,…, n} 中 的 任 一 个 ， 故 总 的 序列 数 为 


六 b, ,b。; 。 不 妨 设 bo=1， 故 得 递 推 式 ; 


1=] 
b= 
和 n>1 
| 
I 1 (QnD)! 1  。 a 
通 式 为 b = 一 一 -一 一 = 一 一 C?，( 见 附录 了 上)， 前 几 项 为 1, 2, 5, 14, 42, 132, 429,…。 


n+l nin! n+l 

证 二 : 将 进 、 出 栈 分 别 用 “1”、“0” 表 示 ， 则 n 个 数据 的 进出 栈 过 程 可 表示 为 2n 位 
二 进 制 数 ， 其 中 “1” 和 “0” 各 占 n 位 。 

在 2n 位 中 填 入 n 个 1 (其 余 赴 0) 的 方案 数 为 C? ， 其 中 有 些 不 符合 要 求 ( 从 左 问 右 
扫描 ， 遇 到 0 的 个 数 比 1 的 个 数 多 时 )， 减 去 这 些 不 符合 要 求 的 方案 数 即 为 所 求 。 

设 序列 在 某 位 k 时 不 合 要求 了 ， 即 此 时 0 比 1 多 1 个 ， 则 其 后 面 1 比 0 多 1 个 。 若 把 
后 面 的 0 和 1 互 换 ， 则 整个 序列 为 nt1 个 0 和 nl 个 1 组 成 的 2n 位 数 ， 即 一 个 不 合 要 求 
的 方案 对 应 于 一 个 由 n+1 个 0 和 nl1 个 1 组 成 的 2n 位 数 。 

反之 ， 任 何 一 个 由 n+l1 个 0 和 nl1 个 1 组 成 的 2n 位 数 ， 从 左 向 右 扫描 ， 必 在 某 个 位 
置 k 时 0 的 个 数 比 1 的 个 数 多 (一定 会 出 现 ， 至 少 因 为 0 比 1 多 )。 同样 ， 此 时 把 其 后 面 的 
0 和 1 互 换 ， 则 得 到 由 n 个 0 和 nn 个 1 组 成 的 2n 位 数 ， 即 n+l 个 0 和 n-l 个 1 组 成 的 2n 
位 数 必 对 应 一 个 不 符合 要 求 的 方案 。 

因而 不 合 要 求 的 方案 数 与 ntl1 个 0 和 nn-l1 个 1 组 成 的 2n 位 数 一 一 对 应 ,这 些 数 有 C2 
个 (对 0 而 言 ) 或 Ci 个 (对 1 而 言 ， 二 者 相等 )， 所 以 有 效 的 输出 序列 的 总 数 
=C% 一 C2 a 

n+l 

3.3 解 : 栈 的 特点 是 先进 后 出 ， 队 列 的 特点 是 先进 先 出 。 如 果 用 两 个 栈 ， 一 个 栈 S 先 

进 后 出 ， 另 一 个 栈 工 后 进 先 出 ， 两 者 组 合 则 可 实现 先进 先 出 。 入 队 时 ， 知 栈 工 非 空 ， 则 先 
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将 工 中 元 素 反 入 栈 到 S 中 ， 再 将 输入 数据 入 栈 S$; 出 队 时 ， 帮 栈 工 非 空 ， 则 从 工 中 出 栈 ， 
否则 先 将 S 元 素 依次 出 栈 并 入 栈 T， 再 从 了 中 出 栈 。 以 A 入 、B 入 、C 入 、A 出 、B 出 、 
D 入 、C 出 的 队列 顺序 为 例 ， 栈 S 和 TI 的 变化 如 下 网 所 示 。 


中 国有 


A 入 ,B 入 ,C 入 ”A 出 之 前 A 出 之 后 B 出 之 后 。 D 入 之 前 D 入 之 后 C 出 之 前 ””C 出 之 后 
( 原 T 空 转 T) ( 原 T 非 空转 S) ( 原 T 空 转 T) 


通俗 地 讲 ， 一 个 栈 不 能 先进 先 出 ， 为 达 目 的 ， 用 另 一 个 栈 把 数据 “ 倒 腾 ” 一 下 。 
3.4 解 : 共享 顺序 栈 的 类 型 定义 和 进出 栈 算法 如 下 : 


typedef struct { 
datatype data[lmaxsizel]; 
int topl21s 
1 Sqstacks 
Vold init (sqstack *S) { 
S—->top[0]=-—1; 
S—->top[l1]=maxsize; 
} 
int push(sqstack *S,datatype x,int k) { 
if(S->top [0]+1==S->top[1]) {cout<<“ 栈 满 ， 不 能 进 栈 ! \n”;return 0;} // 上 洲 


OmWF 


if (k==0) S->top[k]++; // 改 栈 项 指针 ， 加 1 或 减 1 
else ED <= 
sq->data[S->top [k] ]=x; // 将 x 插入 当前 栈 顶 


return 1; 
} 
int pop (sqstack *S,datatype *x,int k) {// 栈 顶 元 素 由 参数 返回 


1f((k==0 && S->top [K]==-1) || (k==1 && S->top[k]==maxsize)) 
{cout<<” 栈 空 ， 不 能 退 栈 ! \n”;return 07}V// 下游 

*x=sq—>data[S->top[k]]; // 取 出 栈 顶 元 素 值 给 x 

te0N SEEopINE: // 改 栈 顶 指针 ， 减 1 或 加 1 

else SLopLkltt: 


return 1; 
} 


3.5 解 ， 当 数据 为 负 时 直接 输出 ， 若 为 正则 进 栈 。 当 输入 数据 处 理 完 后 ， 栈 内 都 为 正 
数 ， 将 其 依次 出 栈 输 出 即 可 。 假 设 输入 数据 为 整数 ， 并 存放 在 数组 中 ， 则 算法 如 下 : 


Vold order(int A[],int n) { 
了 下 2 
sqstack 5S; / /假设 采用 顺序 栈 
init sqstack(&Ss); 
for (i=0;1i<n;1++) 
if(A[i]>0) push sqstack(&S,A[i]); 
else COout<<ATLTI<” 
while(!empty sqstack(Ss)) { 
pop sqstack (&S, &x); 
SoteTae 
} 
cae Vn 


} 
3.6 解 : 
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方法 1: 对 表达 式 扫 描 ， 遇 到 左 括号 “<” 就 进 栈 ， 迪 到 右 插 号 “)” 残 退 栈 。 奋 中 途 
出 现 栈 空 又 要 退 栈 则 右 插 号 有 多 余 ; 知 结 束 时 栈 非 空 ， 则 堪 括 号 有 多 余 。 算 法 略 。 

方法 2: 设置 括号 计数 器 n， 初 值 为 0。 扫描 表达 式 ， 遇 到 “(” 则 n+t+， 巡 到 “)” 则 
n--。 右 中 途 出 现 n<0 则 右 括号 有 多 余 ; 奉 结束 时 n>0， 则 左 括号 有 多 余 。 算 法 略 。 

3.7 解 : 将 单 链 表 各 元 素 依 次 进 栈 ， 绸 依次 出 栈 。 假 设 链表 没有 头 络 点 ， 算 法 如 下 : 


Vold inverse (lklist head) 1{ 
pointer p; 
Sgstack SS 
init sqstack(&S) ; 
p=head; 
while(p!=NULL) { 
push sqstack(&S,p->data); 
p=p—>next; 
} 
p=head; 
while(!empty sqstack (&S)) { 
pop sqstack(&S, &p->data); 
p=p—>next; 
} 
} 


3.8 解 : 

方法 1: 先 将 链表 的 前 一 半 字 符 依 次 进 栈 ， 然 后 依次 出 栈 与 链表 的 后 一 半 字 符 依 次 比 
较 〈 当 字符 数 为 奇数 时 ， 中 间 位 置 上 的 字符 不 入 栈 也 不 比较 )。 算 法 略 。 

方法 2: 先 将 链表 的 所 有 字符 依次 进 栈 ， 然 后 将 后 一 半 的 字符 依次 出 栈 与 链表 从 头 开 
始 的 前 一 半 字 符 依 次 比较 。 算 法 略 。 

方法 3: 不 用 辅助 栈 ， 先 将 链表 的 前 一 半 字 符 就 地 逆 置 ， 再 依次 与 链表 的 后 一 半 字 符 
依次 比较 。 判 断 结束 后 ， 上 再 将 链表 的 前 一 半 字 符 逆 置 回 去 。 算 法 略 。 

3.9” 解 : 一 些 简单 的 递归 可 以 转换 为 循环 ( 见 第 5 章 )， 反 之 ， 一 些 简单 的 循环 也 可 
以 转换 为 递归 。 这 里 的 关键 是 将 问题 写成 递归 形式 。 设 fo=1+2+3+…+n， 则 显然 
fn)=fn-l)+n， 且 人 D)=1， 于 是 得 到 递归 算法 如 下 : 


int sum(int n) { 
TFT return 1 
return f (nl1)+n; 

} 


3.10 解 : 这 时 头 指 针 为 fontrear->next， 队 衬 的 条 件 为 rear->nextFrear。 出 队 时 采用 
等 效 算法 ， 删 除 原 头 结 点 ， 使 原 首 结 点 成 为 头 结 点 。 算 法 如 下 : 


void enqueue (lklist rear,datatype x) 1{ 
pointer p; 


p=new node; // 申 请 新 结 点 空间 
p->data=x; // 给 新 结 点 赋值 
p->next=rear->next; // 新 结 点 next 指 回头 结 点 
rear->next=p; // 原 尾 指 针 指 回 新 结 点 
Es // 新 结 点 成 为 新 尾 结 点 


} 
int dequeue (lklist rear,datatype *x) { 
pointer s; 


if (rear->next==rear) {cout<<“ 队 空 ， 不 能 出 队 ! \n”;return 0;}// 队 空 下 洲 
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s=rear—>next; //s 指 癌 头 结 点 
*x=s—>next—>data; // 取 出 原 队 头 数 据 
rear->next=s->next; // 头 指针 指 回 蛛 队 头 
delete 5s; / /释放 原 头 结 点 


return 1s 


} 
3.11 解 : 注意 到 队列 的 循环 性 ， 利 用 取 梗 运 复 ， 可 得 三 者 之 间 的 关系 为 : 


len=(rear—frontt+m)%om 
rear=(front+len)%m 
front=(rear—lent+m)%m 
3.12 解 : 
(1) 这 里 需 对 出 队 算 法 进行 修改 ， 即 出 队 时 先 计 算 队 头 指针 front=(rear-lent+m)%m， 
然后 再 循环 加 1， 这 两 句 可 合 写 为 front=(rear-lentm+1)%m。 男 外 ， 由 于 已 知 队 列 长 度 ， 
所 以 判断 上 下 洲 的 条 件 也 要 修改 。 算 法 如 下 : 


int en sqqueue (sqqueue *sq,datatype x) { 
if((sq->len==m) {prinf(“ 队 满 ， 不 能 入 队 ! \n”) ;return 0;}// 队 满 上 洲 
sq—>rear= (sq—->reart+l) %m; 
sq—->datal[lsq->rear]=x; 
return 1; 

} 

int de sqqueue (sqqueue *sq,datatype *x) { // 出 队 ， 由 x 返回 原 队 头 值 
int Tronts 
if (sq->len==0) {cout<<” 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 空 下 洲 
front=(sq—->rear-sq->len+m+] ) %m; 
*x=Sq—>datalfront]; 
return 1; 


} 


(2) 与 上 题 类 似 , 这 里 要 修改 入 队 算 法 , 即 入 队 时 先 计 算 队 尾 指针 rear=(frontt+len)%m， 
然后 再 循环 加 1， 这 两 句 可 合 写 为 rear=(fronttlen+1)%m。 同 样 ， 由 于 已 知 队 列 长 度 ， 所 以 
判断 上 下 洲 的 条 件 也 要 修改 。 算 法 如 下 : 


int en sqqueue (sqqueue *sq,datatype x) 1{ 
int rear; 
if((sq->len==m) {prinf(“ 队 满 ， 不 能 入 队 ! \n”) ;return 07}V// 队 满 上 游 
rear= (sq->front+sq—->len+1)%m; 
sq—->datalrear|]=x; 
return 1; 

} 

int de sqqueue (sqqueue *sq,datatype *x) { // 出 队 ， 由 x 返回 原 队 头 值 
if (sq->len==0) {cout<<“ 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 空 下 洲 
sq—>front= (sq->front+]) %m; 
*x=Sq—>datalsq->front]; 
return 1; 

} 


(3) 标记 位 的 含义 不 同时 ， 算 法 会 有 所 不 同 。 以 下 假设 标志 位 定义 如 下 : 硅 入 队 后 出 
现 rear=front， 则 置 flag=1; 其 他 情况 fag=0。 于 是 队 衬 条 件 为 rear=front 日 fag=0， 队 满 条 
件 为 lag=1。 算 法 如 下 : 
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int en sqqueue (sqqueue *sq,datatype x) { 
if (sq->flag==1) {prinf(“ 队 满 ， 不 能 入 队 ! \n”) ;return 0;}// 队 满 上 淤 
sq—>rear= (sq->reart+l) %m; 
sq—->datal[lsq->rear]=x; 
1f (sq—->rear==sq->front) sq->flag=1; 
return 1; 
} 
int de sqqueue (sqqueue *sqg,datatype *x) { // 出 队 ， 由 x 返回 原 队 头 值 
if (sq->rear==sq->front && Sq->flag==0) 
{fcout<<” 队 空 ， 不 能 出 队 ! \n”;return 0;} // 队 空 下 洲 
sq->front=(sq->front+1) %m; 
*x=Ssq—>datalsq->front]; 
sq—>flag=0; 
return 1; 
} 


也 可 用 flag=1 表示 衬 ， 其 他 情况 flag=0; 或 者 flag=1 表示 满 ，flag=-]1 表示 空 ， 其 他 
情况 flag=0 表示 既 不 空 也 不 满 等 ， 上 述 算 法 要 相应 地 进行 调整 。 

3.13 解 : 这 里 循环 队列 元 素 的 下 标 范 围 是 1 到 my, 即 当 front 和 rear 当前 位 置 为 m 时 ， 
入 队 或 出 队 后 下 一 个 位 置 应 为 1， 这 时 循环 意义 的 加 1 语句 为 : =i%mt+1。 

(1) 初始 化 : rear=front=1( 可 为 1 到 m 中 任 一 值 ) 

(2) 入 队 : rear=rear%m+]: data[Tear]=x: 

(3) 出 队 : front=front%m+]: x=data[front]: 

(4) 队 容 : rear=front 

($5) 队 满 : rear%m+1=front 

3.14 解 : 这 时 如 果 front=rear， 则 队列 中 只 有 1 个 元 素 ; 奋 册 出 队 则 队 空 ， 此 时 front 
比 rear 大 1〈 循 环 意义 下 )， 但 显然 队 满 时 front 也 比 rear 大 1， 即 该 条 件 不 能 区 分 队 空 和 
队 满 。 这 里 采用 恋 本 的 方法 ， 即 当 队 列 仅 剩 一 个 单元 时 认为 队 满 ， 以 便 区 分 队 空 和 队 满 。 
于 十 : 

队 衬 : front=(rear+l)2%om 

队 满 : front=(rear+2)%m 

初始 化 : rear=0: front=1: 

入 队 : rear=(rear+1)%m: data[Tear]=X: 

出 队 : x=data[front]: front=(front+1)%m: 

长 度 : len=(rear-front+l+m)%m 

3.15 解 : 操作 过 程 如 下 : 

(1) 将 栈 中 所 有 元 素 依次 出 栈 、 入 队 ， 则 栈 空 ， 队 列 为 {Bj,B,,…,B,,A,,Ari,…,Al} 。 

(2) 将 也 |,B，…,B 依次 出 队 、 入 队 ， 则 队列 为 {A ,A Ai,B,B,…,B,} 。 

(3) 将 {AAA 出 队 、 入 栈 ， 则 栈 为 {A,,A,i,…,Ai( 栈 顶 )}， 队 列 为 {B， 
B,,..…,B,}. 

(4) 依次 B; 出 队 、 入 队 ，A; 出 栈 、 入 队 ， 则 最 后 为 {Bi,Al,B,,A,,B,,A;,…,B,,A,}。 

总 的 运算 量 为 2n+2n+2n+4n=10n。 

3.16 略 

3.17 解 : (1) 两 者 相同 ; (2) 两 者 之 一 为 空 串 ; (3) 其 中 一 个 为 另 一 个 的 重复 串 。 
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3.18 解 : 假设 串 结束 和 从 为 “0”， 算法 如 下 : 


Vold concat (char sl[],char s2[]) { 


nt 3 

1=0; 

while(sl[i] !=’\0’) i++; // 找 到 串 sl 的 尾部 
J]=0; 

while(s2[j]!=’\0’) sli[i++]=s2[j++]; // 串 s2 连接 到 sl 的 尾部 
sl1[i]=\0’; // 置 结束 符 


} 
3.19 解 : 假设 串 结束 符 为 “\0”， 算 法 如 下 : 


void copy(char sl[],char s2[]) { 


int J]; 
J]=0; 
while(s2[j]!=’\0) sl1[j]=s2[j++]; // 串 s2 拷贝 到 sl 
s1[j]=’\0’; // 置 结束 符 
} 
3.20 解 : 依次 取出 S 的 每 个 字符 , 然后 与 工 的 所 有 字符 进行 比较 , 设 链 表 不 带头 结 点 ， 
算法 如 下 : 


pointer find(lkstring S,lkstring T) { 
pointer p,q; 
P=” 7 
while(p!=NULL) { 
q=T; 
while (gq!=NULL && qdq—->ch!=p->ch) qdq=q->next; 
if (q==NULL) return p; //T 中 没有 S 的 当前 字符 
p=p—>next; 
} 
return NULL; //S 的 所 有 字符 均 在 T 中 出 现 
} 


3.21 解 : 这 时 数组 从 下 标 1 开始 存放 字符 串 ， 不 妨 将 串 元 素 序 号 也 从 1 开始 ， 则 类 
似 从 0 开始 时 的 推导 可 得 : 设 比 较 失 败 时 主 串 、 模 式 串 位 置 分 别 为 ij 即 si 天 ft 之 前 “bt… 
t1” 二 “SiSi41…Si1”。 若 刁 之 前 模式 串 存在 “tito…tkx-1”= 二 “tptpr1…1” 的 首尾 重复 子 串 ， 
则 主 串 可 从 当前 位 置 s; 继续 和 模式 串 的 区 比较， 仍 记 next[j]j=k， 这 时 next[j] 的 定义 为 : 


, 当 j=1 时 
next[j 片 1max fl1<k<i 且 “t…t 1 一“t; 4-…t;， 当 此 集合 非 空 时 
1 其 他 情况 
注意 这 时 的 含义 为 首尾 重复 子 串 的 长 度 (=k&-1) 加 1。KMP 算法 如 下 : 
#define MMRAX 100 / /MMAX 为 串 长 上 限 (不 能 超过 1 字 节 最 大 整数 255) 


typedef char sstring[MMAX+1];//0 号 单元 存放 串 长 (不 能 超过 MMRAX) 
void NEXT1(sstring *t,int next[]) {V// 求 next， 串 从 t[1] 开 始 
2 
J]=1;k=0;next[1]=0; 
while(j<t[0]) { //t[0] 存 放 串 长 
if (k==0 || 七 []]== 七 [k]) { 
J++;? K++; 
next [J]]=k; 
} 
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else k=next [k]; 
} 
} 
int KMP1 (sstring *s,sstring #t) {//KMP 算法 ， 串 从 s[1]、t[1] 开 始 
Tn 1 1 
int next [MMAX+1]; 
NEXT1 (t, next); 
1=1,]=1; 
while(i<=s[0] && j<=t[0]) { //s[0]、 臣 [01 存放 串 长 
if(J==0 || s[i]==t[jJ]) {i++;]J++;} 
else J=next []] :; 
} 
1If(]>t[0]) return 1-t[0]; 
else return 0; 
} 


3.22 解 : 有 2 种 情况 〈 两 者 着 1， 但 实际 效果 相同 ): 


串 元 素 序 号 从 0 开始 串 元 素 序 号 从 1 开始 
] 0 1 2 3 4 5 6 7 8 9 10 1] 2 3 4 $5 6 7 8 9 10 1 
模式 bc a a c¢c a ba ¢c a a b c a a c a ba c a 
next|]] -1] 0 0 0 1 1 0 1 2 1 0 1 和 3 1 
nextvall]|] -1 0 0 -1 1 1 -1 0 2 1 -l 0 1 0 和 2 013 2 0 


其 中 也 可 令 前 者 next[0]=0， 后 者 next[1]=1， 这 时 需 对 KMP 算法 语句 略 作 调整 。 
第 4 章 多维 数 组 和 广义 表 


4.1 解 : 按 行 序 排列 时 先 变 右边 的 下 标 ， 结 果 为 : 


AL- [li[3]、\ AL-1] {114]、\ AL-1] 21 LS 、 人 AL- [2]114]、v ALOL [ILI3], ALOT LIL] TA], 
AL0O] [2]1[3]、 A[L0] [2]14] 


按 列 序 排列 时 先 变 左边 的 下 标 ， 结 果 为 


A[-1] IIS、 AI [i] {3}、 A[-1][2][3]、 ALO] [21[3]、 A[-1][i]l[4]、 AL[O][1][4]、 
A[-1] [2] [4]、 ALO] TL2]14] 


4.2 解 : 按 行 存储 时 ， 从 数组 开始 元 素 A[rl][s1][tl] 到 A[rj[s][t 的 元 素 个 数 为 
k=(r-r])x(s2 一 s1+1)(t2 一 tl 十 1)+(s 一 s1)x(t2 一 tl1+1)+(t-tl+1)， 所 求 地 址 为 : 

loc(r,s,t}=1oc (rl sl, 二 LHC 

按 列 存储 时 ， 从 数组 开始 元 素 A[rl][s1][tl] 到 Arrslrb 的 元 素 个 数 为 
k=(t-t1)x(s2 一 s1+1)(r2-r1+1) +(s 一 s1)x(r2-r1+1)+(r-r1+1)， 所 求 地 址 为 : 

DCT SEEEOCYTE SL TIETUE= LXE 

4.3 解 : 上 三 角 部 分 的 前 二 1 行 元 素 个 数 为 ntCn-1)+O-2)+…+C-it2)， 第 1 行 从 对 角 
元 素 到 第 j 列 元 素 个 数 为 ]-1t+1， 所 以 

k= [n+ (nl1)+(n-2)+*…+ (ni+2) ]+(j-i+1)=i [no (i-1)/2]+]j-n 


4.4 解 : 设 行 号 为 1， 列 号 为 ]， 则 : 
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k=1(1—1)/2t] (1<])) 
注意 ] 的 范围 1<j1， 由 上 式 得 
i(i—1)/2+1<k<iG~1)2+i=i(i+1)2， 即 -2k+2 志 0 且 ti-2k 宕 0 
解 该 不 等 式 组 ， 得 
Vl+8k—1 . .Vl+8k—8+l _ Vl+8k+1 VI+8k-1 由 


<1< 
2 2 2 pp 


] 


即 
1 _ Vl+8k—1 

求 出 1 后 便 可 得 j=k-i(i-1)/2。 

4.5 解 : 设 三 元 组 表 按 行 序 存放 。 算法 中 先 找 第 1 行 开 始 位 置 , 再 找 第 j 列 。 算 法 如 下 : 


datatype get (spmatrix *A,int i,int ]) { 


int p; 
Rl // 设 三 元 组 表 从 下 标 1 开始 使 用 
while (p<=A->t && A->data[p] .i<i) p++; // 找 第 工行 


if(p>A->t || A->data[p].i!=i) return 0;  // 无 第 工行 元 素 
while (p<=A->t && A->data[p] .1i==1 && A->data[p].j<j) p++; // 找 第 j 列 
if (p>A->t || A->data[p].j!=j]) return 0; // 无 第 jj 列 元 素 
else return A->datalpl] .val; 
} 


以 上 查找 的 条 件 取 为 datafp]i<i 和 datafp]j<j， 而 不 是 datafp]i!=i 和 datafp]j!=j， 这 是 
利用 了 三 元 组 按 行 序 排列 的 特点 ， 即 元 素 按 行 号 递增 排列 ， 同 行 的 元 素 按 列 号 递增 排列 。 
这 样 可 使 在 得 找到 行 号 或 列 号 大 于 给 定 值 时 提前 结束 而 不 必 扫 摘 完 所 有 三 元 组 。 

为 了 避免 得 找 过 程 中 对 三 元 组 下 标 范 围 的 检查 ， 可 以 采用 “监视 哨 ” 技 术 ， 即 得 找 前 
先 在 tl 处 存 入 (i,j, x)， 其 中 x 任意 。 则 不 论 是 对 行 还 是 对 列 的 查找 ， 最 多 结束 于 tt1 处 。 
算法 如 下 : 

datatype get (spmatrix *A,int i,int ]) { 

int p; 

A—>data [A—>t+1] .1=1; 

A->data [A-—>t+1] .j=]; 

p=1; 

while (A->data[p] .i<i) p++; // 找 第 i 行 

if (p>A->t || A->data[p] .i>i) return 0;  ”// 无 第 i 行 元素 
while (A->data[p] .i==i && A->datal[p] .j<]) p++; // 找 第 j 列 
if (p>A->t || A->data[p].j>j) return 0;  // 无 第 j 列 元 素 
else return A->datalp] .val; 

} 


如 果 对 三 元 组 表 从 后 加 前 搜索 ， 则 把 “监视 哨 ” 设 在 0 号 单元 , 以 上 算法 需 略 做 修改 。 
4.6 可 借鉴 题 4.5 的 方法 求 各 元 素 的 位 置 ， 上 基体 略 。 

4.7 注意 下 三 角 上 压缩 存储 时 元 素 地 址 的 对 应 关系 即 可 ， 有 具体 略 。 

4.8 注意 按 行 存 储 时 元 素 地 址 的 对 应 关系 即 可 ， 有 具体 略 。 

4.9 略 

4.10 解 : 

(1) 取 表 尾 A=tail(L): 得 到 ((there, (the, here), where), which, what)。 
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(2) 取 表 头 B=head(A): 得 到 (there, (the, here), where)。 

(3) 取 表 尾 C=tail(B): 得 到 ((the, here), where)。 

(4) 取 表 头 D=head(C): 得 到 (the, here)。 

(5) 取 表 尾 E=tail(D): 得 到 (here)。 

(6) 取 表 头 F=head(E): 得 到 here。 

总 的 过 程 为 :head(tail(head(tail(head(tail(1)))))) 

4.11 解 : 长 度 =4、 深 上 度 =3、 表 头 =(this)、 表 尾 见 上 题 (1)。 


第 5 章 树 形 结构 


5.1 解 : 二 又 树 每 个 结 点 最 多 两 个 孩子 ， 即 结 点 的 度 最 大 为 2， 但 也 可 能 所 有 结 点 的 
度 都 不 为 2， 如 只 有 1 个 结 点 ， 或 单 校 树 等 ， 所 以 二 又 树 的 度 并 不 一 定 是 2。 
5.2 解 : 三 叉 树 中 结 点 总 数 n 等 于 各 种 度数 的 结 点 数 之 和 : 
n=—notnitn2+n3 
另 一 方面 ， 由 于 1 度 结 点 有 1 个 孩子 ， 故 三 叉 树 中 孩子 结 点 数 为 ni+2nz+3ns， 但 根 不 是 
任何 结 点 的 孩子 ， 故 三 叉 树 结 点 总 数 又 可 表示 为 孩子 结 点 数 和 根 之 和 : 
n=n1+2n2+3n3+1] 
上 面 两 式 相 减 ， 即 得 叶子 数 no=nz+2na+1 。 
5.3 解 : 设 叶 子 结 点 有 no 个 ， 则 非 叶 子 结 点 〈 即 分 文 结 点 ) 有 n-no 个 ， 每 个 分 文 对 应 


一 个 骇 子 ， 故 孩子 忆 数 为 0-no)k 个 ， 但 树 中 除根 外 其 余 结 点 都 是 孩子 ， 有 nm-1 个 ， 所 以 
n 一 1]=(n-nojk， 从 中 可 得 no=n-(n-1) 人 kk。 

特别 地 ， 满 二 又 树 中 叶子 数 为 n-(n-1)/2=(n+1)/2。 

5.4 解 : 这 种 二 叉 树 只 要 每 一 层 一 个 结 点 即 可 ， 故 可 有 多 棵 。 相 当 于 在 高 度 为 n 的 满 
二 又 树 上 沿 分 文 关系 每 一 层 取 1 个 结 点 ， 得 到 的 是 根 到 叶子 的 路 径 ， 所 以 这 种 二 又 树 的 个 
数 就 是 满 二 又 树 的 叶子 数 。 高 度 为 n 的 满 二 叉 树 有 2” 个 叶子 ， 即 这 种 二 叉 树 有 2” 个 。 


SS 解 : 

(1) 注意 树 的 子 树 不 分 左右 ， 而 二 又 树 的 子 树 分 左右 ， 所 以 3 个 结 点 的 树 只 有 2 种 形 
态 ，3 个 结 点 的 二 义 树 有 5 种 形态 ， 见 下 图 。 

六 < | 
(a) 3 结 点 树 的 2 种 形态 (b) 3 结 点 二 叉 树 的 5 种 形态 

每 种 形态 下 3 个 结 点 的 不 同 排 列 有 3!=6 种 ， 故 3 个 结 点 的 树 和 二 又 树 分 别 有 2x6=12 
和 5x6=30 棵 不 同 的 树 。 

(2) 对 二 叉 树 可 递 推 求 。 设 n 个 结 点 的 二 叉 树 的 形态 数 为 bb。 若 左 子 树 结 点 数 为 1， 
则 右 子 树 结 点 数 为 n-1-1， 于 是 二 又 树 形态 数 为 bibni-1。 但 1 可 以 是 0,1,2,…,n-l1 中 的 任 


n—l 
一 个 ， 故 总 的 形态 数 为 ybib。 , 。 显 然 ，n=0 时 形态 数 为 1 ( 即 空 树 )， 故 得 递 推 式 : 


1=0 
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b, =I 
n—l 
本 ny>1 
i=0 
、 1 (2nD! 1  ，。 Pog 人 
通 式 b = 一 -一 一 = 一 一 C? 〈 见 附录 EE), 前 几 项 为 {1, 2, 5, 14, 42, …}, 增长 很 快 。 


ni+l nin! n+t+l 
这 个 结果 与 给 定 入 栈 顺序 时 ， 所 有 可 能 的 出 栈 次 序数 相同 〈 习 题 3.2)。 实 际 上 ， 二 又 
树 的 中 根 壳 历 过 程 就 是 一 系列 结 点 的 进出 栈 过 程 ， 因 此 ， 假 设 入 栈 顺 序 就 是 二 又 树 的 先 根 
序列 ， 则 所 有 可 能 的 出 栈 次 序 就 是 所 有 可 能 的 中 根 序 列 ， 而 二 叉 树 由 先 根 序 列 和 中 根 序列 
决定 ， 所 以 二 叉 树 的 形态 数 和 可 能 的 出 栈 次 序数 二 者 是 一 致 的 。 


对 于 树 ， 可 想象 先 将 其 转换 成 二 又 树 ， 由 于 转换 后 二 又 树 没有 右 子 树 ， 所 以 n 个 结 扣 
树 的 形态 数 刀 和 ml1 个 结 点 二 又 树 的 形态 数 bw- 相同 ， 即 二 bn1。 
5.6 解 : 


(1) 先 序 序列 为 DLR， 中 序 序列 为 LDR， 二 者 相同 则 需 没有 世 ， 即 任 一 点 都 没有 左 子 
树 ， 该 二 又 树 为 右 单 支 树 。 另 外 ， 空 树 也 满足 条 件 。 

(2) 后 序 序列 为 LRD， 中 序 序列 为 LDR， 二 者 相同 则 需 没 有 及 ， 即 任 一 点 都 没有 右 子 
树 ， 该 二 又 树 为 左 单 支 树 。 另 外 ， 空 树 也 满足 条 件 。 

(3) 先 序 序列 为 DLR， 后 序 序列 为 LTRD， 二 者 相同 则 需 没 有 工 和 R， 即 二 又 树 只 有 
一 个 结 点 。 另 外 ， 空 树 也 满足 条 件 。 

(4) 先 序 序列 为 DLR， 中 序 序列 为 LDR， 后 序 序列 为 LTRD， 三 者 相同 则 需 没 有 世 和 
R， 即 二 叉 树 只 有 一 个 结 点 。 另 外 ， 空 树 也 满足 条 件 。 

(5) 先 序 序列 为 DLR， 后 序 序列 为 LRD， 二 者 相反 则 需 L 和 R 中 有 一 个 没有 ， 或 两 
个 都 没有 ， 即 任 一 点 只 有 一 个 子 树 ( 单 支 树 )， 或 仅 含 一 个 结 点 ( 它 既是 根 又 是 叶子 )， 它 


们 的 共同 特点 是 树 中 只 有 一 个 叶子 。 

5.7 解 : 

(1) 中 序 序列 为 LDR， 先 序 序列 为 DLR， 显 然 ， 若 无 R 但 有 工 ， 则 中 序 序列 的 最 后 
一 个 结 点 是 根 R， 而 先 序 序列 的 最 后 一 个 结 点 在 工 中 ， 显 然 结 论 不 对 。 易 见 ， 帮 中 序 序列 
的 最 后 一 个 结 点 是 叶子 的 话 ， 结 论 正 确 。 


(2) 后 根 序列 为 LRD， 道 序 后 为 DRL， 即 按 根 、 右 子 树 、 左 子 树 的 顺序 遍历 即 可 。 

5.8 解 : 

(1) 考虑 完全 二 又 树 的 层 序 编写。 编写 为 1 的 结 点 大 为 叶子 ， 则 没有 左 孩 子 ， 妈 2i>n， 
所 以 i 这 m2 的 结 点 都 为 叶子 ， 或 者 说 i 万 n2 的 结 点 为 非 叶子 ， 所 以 非 叶 子 结 点 有 | 2 | 个 ， 
叶子 结 点 有 n 一 | v2|=|[w2| 个 ， 即 叶子 和 非 叶 子 结 点 都 有 一 半 左 右 。 

(2) 严格 二 又 树 中 没有 度 为 1 的 结 点 ， 所 以 n=notnz， 而 no=n2+1， 此 二 式 联 立 即 得 
no=(n+1)/2。 注 意 ， 对 这 类 二 又 树 ，no=nz+1 就 是 说 叶子 比 非 叶 子 结 点 数 多 1。 

特别 地 ， 满 二 又 树 既 是 完全 二 义 树 ， 又 是 严格 二 又 树 ， 所 以 其 叶子 数 也 为 no=(n+1)/2。 

5.9 证 明 : 

(1) 设 结 点 总 数 为 m， 由 上 题 有 mn=|m2| ， 若 mm 为 偶数 ， 则 n=| m2 | =m/2 ， 所 以 
m=2n; 若 m 为 奇数 ， 则 n=| m2 | =(m+1)/2， 所 以 m=2n-1。 
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或 证 : 由 于 m=notnitn2， 而 no=n2+1， 所 以 m=-2no+tni-1。 而 完全 二 叉 树 度 为 1 的 结 点 
数 要 么 为 0， 要 么 为 1]， 所 以 m=2no 或 2n0-1。 

由 此 题 可 知 ， 叶 子 数 一 定 的 完全 二 叉 树 可 有 两 柠 。 

(2) 设 其 深度 为 k， 则 当 其 为 满 二 叉 树 时 ， 叶 子 数 最 多 ， 都 在 最 底层 ， 为 2”';， 当 其 
倒数 第 二 层 叶子 数 最 多 , 最 底层 只 有 1 个 叶子 时 , 叶子 总 数 最 少 , 为 20" -1)+1=2"“。 所 以 : 

2<n2*!， 即 k-2 志 log,n 三 k-1, 或 log, n+1k<1log,n1+2 

由 于 为 整数 ， 所 以 k=|log,n+1| =|log,n|+1, 或 k=|log,n+2| =|log,n|+2。 

(3) 设 深度 为 k， 则 叶子 数 n 夺 2™'!'， 得 log, n+1 志 k, 故 k 宇 [log,n+1| =[log,n|+1。 

5.10 解 : 已 知 叶子 数 的 完全 二 叉 树 一 般 有 两 颗 ( 见 习题 S.9)。 叶 子 数 为 2” 的 完全 二 
又 树 可 以 是 : (1) 深度 为 的 满 二 又 树 。(2) 深度 为 kt1， 最 研 层 只 有 1 个 结 点 ， 倒 数 第 
二 层 除 了 最 左边 的 1 个 结 点 外 ， 其 他 都 是 叶子 ， 即 叶子 数 仍 为 (2™ 一 1)+1=2*。 


5.11 证 : 除根 结 点 外 ， 其 他 每 个 结 点 都 是 某 个 结 点 的 孩子 ， 即 孩子 结 点 数 为 n-1。 每 
个 孩子 对 应 其 双亲 的 一 个 分 支 ， 于 是 所 有 护 子 的 总 数 就 是 所 有 结 点 的 分 支 数 之 和 ， 后 者 即 
所 有 结 点 的 度数 之 和 ， 所 以 a-1= DG)， 即 n= DQ)+1。 

5.12 证 : 由 树 到 二 又 树 的 转换 ， 树 中 每 个 分 文 结 点 ， 在 二 叉 树 中 有 一 个 左 孩 子 ; 该 孩 
子 结 点 的 右 孩 子 ， 右 孩子 的 在 孩子 ，……… ， 在 原 树 中 是 兄弟 关系 ， 其 中 最 后 一 个 没有 右 兄 


弟 ， 它 转换 后 没有 右 孩 子 。 于 是 每 个 分 支 结 点 得 到 一 个 右 子 树 为 空 的 结 点 。 

另外， 和 森林 各 树 的 根 之 间 是 兄弟 关系 ， 最 后 一 个 根 没 有 右 兄 弟 ， 它 转换 后 也 没有 右 孩 
子 。 所 以 总 共有 ntl 个 结 点 没有 右 孩 子 。 

5.13 解 : 层 序 序列 的 第 一 个 结 点 A 即 为 根 ， 再 从 中 序 序列 可 分 
出 其 左 、 右 子 树 ， 即 A 有 两 个 子 树 。 于 是 层 序 序列 的 第 2、3 结 点 也、 
C 即 为 A 的 左 、 右 子 树 的 根 ， 在 中 序 序列 中 又 可 分 出 它们 各 上 自 的 左 、 
右 子 树 。 依 次 类 推 ， 可 逐步 求 出 二 叉 树 ， 其 中 层 序 序 列 的 每 一 个 结 点 
都 是 当前 子 树 的 根 。 结 果 如 右 图 所 示 。 

5.14 解 : 森林 的 先 根 、 后 根 序 列 分 别 与 对 应 二 又 树 的 先 根 和 中 根 序列 相同 ， 于 是 可 先 
画 出 二 叉 树 ， 再 转换 成 森林 。 结 果 如 下 图 所 示 。 


(a) 二 勾 树 (b) 森林 
5.15 解 : 线索 二 又 链表 中 仍然 有 衬 指 针 ， 但 含义 不 同 ， 线 索 为 空 是 指 结 点 没有 相应 志 
历 的 前 趋 或 后 继 ， 左 、 右 指针 为 空 是 指 结 点 没有 左 、 右 孩子 。 一 般 中 序 线索 二 又 链 表 中 有 
两 个 空 指针 ， 先 序 和 后 序 线索 二 又 链表 中 有 一 个 或 两 个 空 指针 。 
5.16 解 : 
(1) 二 叉 树 的 局 上 度 = 左 子 树 和 右 子 树 中 高 度 较 大 者 +1( 根 )。 算 法 如 下 : 


int higqh (bitree t) { // 返 回 二 又 树 的 高 度 
int L,R; 
if (t==NULL) return 0; // 当 前 树 为 空 ， 递 归 出 口 
L=high (t->lchild); // 求 左 子 树 高 度 
R=high (t—->rchild); // 求 右 子 树 高 度 


} 


return (L>R?L:R)+1; 


(2) 如 果 根 结 点 的 度 不 为 1， 则 二 又 树 中 度 为 1 的 结 点 数 = 左 子 树 中 度 为 1 的 结 点 数 + 
右 子 树 中 度 为 1 的 结 点 数 ， 若 根 结 点 的 度 为 1， 则 要 在 此 基础 上 再 加 1( 根 )， 算 法 如 下 ; 


int suml (bitree 七 ) { // 返 回 二 叉 树 中 度 1 的 结 点 数 
int L,R; 
if (t==NULL) return 0; // 当 前 树 为 衬 ， 递 归 出 口 
L=suml (七 ->Lchild) ; // 求 左 子 树 中 度 为 1 的 结 点 数 
R=suml (t->rchild) // 求 右 子 树 中 度 为 1 的 结 点 数 


} 


if((t->lchild==NULL && t—->rchild!=NULL) || 
(t->lchild!=NULL && t->rchild==NULL)) // 当 前 结 点 ( 根 ) 的 度 也 为 1 
return L+R+1l1; 
else 
return L+R; 


类 似 可 求 上 度 为 2 的 结 点 数 ， 同 样 要 根据 当前 根 的 度 是 否 为 2 来 返回 L+R 或 L+R+1。 
(3) 按 先 根 壳 历 思想 进行 查找 ， 算 法 如 下 : 
pointer search (bitree t,datatype x) { // 返 回 查 找到 的 结 点 的 地 址 


} 


pointer p; 

if (t==NULL) return NULL; // 空 树 

if (t->data==x) return t; // 访 问 根 : 大 找到 就 返回 之 ( 跳 过 子 树 的 检查 ) 
p=search (t->lchild) || p=search(t->rchild); // 左 子 树 没有 ， 则 找 右 子 树 
return p; 


5.17 解 : 

(1) 在 二 叉 树 过 历 的 各 种 非 递 归 算 法 上 修改 即 可 ， 即 将 访问 根 修改 为 交换 其 左 、 右 护 
子 。 以 课本 第 3 种 非 递归 先 根 过 历 算法 为 例 ， 交 换算 法 如 下 : 

void exchange3 (bitree t) { // 交 换 各 结 点 左 、 右 子 树 ， 非 递归 先 根 遍 历 型 算法 ， 根 预 入 栈 


} 


pointer p,dq,S[maxsize]l];  // 顺 序 栈 


int top; // 栈 项 指针 

1f (t==NUOLD) Teturns 

top=—1; 

S[++top]=t; // 根 指针 入 栈 

while (top>=0) { // 栈 非 空 ， 循 环 
p=S [top——]; // 出 栈 
q=p->1lchildzp->lchildq=p->rchildzp->rchild=dq;// 交 换 
if (p->lchild!=NULL) S[++top]=p->Lchild; // 原 右 指 针 入 栈 
if (p->rchild!=NULL) S[++top]=p->rchild; // 原 左 指针 入 栈 


} 


(2) 在 二 义 树 过 有 历 的 各 种 非 递 归 算 法 上 修改 即 可 ， 即 将 访问 根 修改 为 判断 它 是 否 为 叶 
子 ， 在 是 则 叶子 计数 需 加 1。 只 体 算法 略 。 
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5.18 解 : 
(1) 方法 1: 在 非 递 归 后 根 壳 历 基 础 上 修改 : 当 后 根 遍 历 访 问 到 结 点 *s 时 ， 栈 中 的 所 
有 结 点 便 是 Xs 的 祖先 ， 从 而 得 到 从 根 到 该 结 点 的 路 径 ， 具 体 算 法 略 。 
方法 2: 递归 判断 : 徊 p 在 t 的 左 子 树 或 右 子 树 中 ， 则 1t 为 p 的 祖先 ， 输出 之 ， 算法 如 下 : 
int ancestor (bltree t,pointer P) { 
1f {tNULL) Teturn 0: 
if (t==p) return 1; 
if (ancestor(t->lchild,p) || ancestor(t->rchild,p)) { 
cout<<t—>data<<endl; 


return 1-: 


} 
return 0; 


} 


注意 ， 该 算法 输出 的 是 p 的 双亲 到 根 的 路 径 。 
(2) 方法 1: 类 似 上 题 方 法 1， 用 非 递归 后 根 轴 历 ， 分 别 求 出 和 和 x*q 的 祖先 ， 从 根 开 
始 对 比 ， 即 可 求 出 它们 的 共同 祖先 。 上 具体 算法 略 。 
方法 2: 类 似 上 题 方法 2， 递归 判断 : 徊 p、q 在 t 的 左 子 树 或 右 子 树 中 ， 则 t 为 p、9q 
的 共同 祖先 ， 输 出 之 。 有 具体 算法 略 。 
5.19 解 : 
(1) 注意 二 叉 树 的 顺序 存储 结构 中 可 能 有 多 个 虚 结 点 。 算 法 如 下 : 
int leaf (int A[],int n) { 
int 1i,num; 
num=0 
for(1i=1;1i<=n;1++) { 
if(R[il==0) continue;  // 虚 结 点 
if (2*i>n) num++; / /孩子 编号 超出 范围 ， 必 为 叶子 
else if(A[2*11=0 t&& AT2*14+11==0) money yy 叶子 
} 


return num; 


} 
(2) 顺序 存储 结构 对 应 于 层 序 序列 ， 故 可 按 层 序 序列 建立 二 又 链表 ， 自 法 见 诛 本 《和 需 


略 作 修 改 )。 由 于 层 序 序列 已 存 于 数组 中 ， 还 可 利用 双亲 与 孩子 结 点 的 编号 关系 进行 建立 ， 
算法 如 下 : 
bitree creat (int 1I) { / /i 为 结 点 序号 ( 设 A[n] 和 n 为 全 局 量 ) 


pointer t; 

if(i>n || A[i]==0) return NULL;  // 该 结 点 不 存在 
t=new node; 

t—->data=A[1i]; 

t—->lchild=creat (2*1); 

t->rchild=creat (2*1i+1); 

return t; 


} 

(3) 这 里 不 能 直接 按 层 序 序列 存储 数组 A， 因 为 层 序 遍 历 中 不 输出 空 ( 虚 ) 结 点 。 下 
面 的 算法 思想 是 将 输出 的 结 点 直接 存 到 对 应 的 数组 位 置 。 为 此 ， 对 某 个 结 点 ， 需 要 知道 它 
的 序号 i, 这 可 利用 双亲 与 孩子 结 点 的 编写 关系 ,从 根 (=1) 开始 , 沿 左 、 右 子 树 2#xi、2#i+1] 
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逐个 计算 出 来 。 算 法 如 下 : 


void creat (bitree t,int 1i) { / /i 为 结 点 序号 ( 设 A[n] 和 nn 为 全 局 量 ) 
pointer 七 ; 
if (i>n) return; / /该 结 点 不 存在 
if (t==NULL) {A[i]=0);return;} // 该 结 点 不 存在 


A[1i]=t->data; 
creat (t—->lchild, 2*1); 
creat (t—->rchild, 2*1+]1); 
} 
5.20 解 : 
(1) 按 安 全 二 又 树 的 层 序 编号 规则 将 结 点 存 于 一 维 数组 ， 告 其 中 无 虚 结 点 就 是 完全 二 
又 树 。 但 这 里 不 需 将 结 点 全 部 存 完 再 检测 虚 结 点 ， 而 是 边 存 储 边 检测 。 算 法 如 下 : 


int detect (bitree t) { // 按 层 序 编 号 判断 完全 二 又 树 
pointer A[maxsize+1]; //maxsize 足够 大 ， 如 取 为 同 高 上 度 的 满 二 叉 树 结 点 数 
了 七 玉 


了 二 【EDEJ Teturn 工 > 
for (1=1;1<=maxsize;1i++) A[i]=NULL; 


i=n=1; //n 为 当前 结 点 编号 最 大 值 
二 [七 ， //L 号 位 置 为 根 结 点 


while(i<=n) { 
if (A[i]==NULL) return 0;// 虚 结 点 
if (A[i]->lchild!=NULL) 
{n=2*i; A[n]=A[i]->lchild;}  // 对 左 孩 子 编号 并 存储 
if (A[i]->rchild!=NULL) 
{n=2*i+1;A[n]=A[i]->rchild;}  // 对 右 孩 子 编号 并 存储 
1 十 十》 
} 
TeGturn le 


} 


(2) 所 谓 二 叉 树 的 宽度 是 指 茶 一 层 上 最 多 的 绪 点 数 。 由 层 序 遇 历 的 特点 可 知 ， 对 茶 层 
第 一 个 (最 左边 ) 结 点 抽 历时 对 应 其 孩子 层 的 开始 ; 对 菏 层 最 后 一 个 (最 右边 ) 结 点 过 历 
后 对 应 其 孩子 层 的 结束 。 据 此 从 根 开始 可 依次 求 出 以 下 各 层 的 宽度 。 

层 序 志 历 需 采用 队列 结构 。 设 front 指 问 当 前 其 孩子 正在 衣 历 的 结 点 (假设 为 第 1 层 )， 
rear 指 问 当前 正在 壳 历 的 结 点 〈 为 front 的 孩子 ， 为 第 1+1 层 ),b 指 问 第 1 层 最 右边 的 结 点 
(为 其 上 一 层 的 最 后 一 个 孩子 ， 即 上 一 层 最 后 的 rear)， 则 当 front=b 时 第 1 层 所 有 点 的 孩子 
都 珊 历 完 ， 于 是 可 求 出 孩子 层 的 宽度 。 算 法 如 下 : 


int width (bitree 七 ) { // 层 序 遍历 求 宽 度 
pointer p,Q[maxsize]; // 队 列 
int front, rear,b; 
int w,count; //W 记录 各 层 最 大 宽度 ，count 累计 当前 层 的 宽度 


1F(t==NUDLDY return 0 
front=rear=—1;} 


Q[++rear]=t; // 根 结 点 入 队 
W=1; // 根 层 宽度 为 1 
count=0，) 

b=rear; 

while (front<b) { // 当 前 层 未 处 理 完 


front++;p=Q[front]; // 出 队 ， 访 问 队 头 
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if (p->lchild!=NULL) { 
Q[++rear]=p->lchild;count++;// 左 孩子 入 队 ， 累 计 孩 子 层 宽度 


} 
if (p->rchild!=NULL) { 
Q[++rear]=p->rchild;count++; // 右 孩子 入 队 ， 累 计 孩 子 层 宽度 


} 


if (front==b) { // 当 前 层 处 理 完 
if (w<count) w=count; 
COUn 七 =0 ; 
b=rear; //b 指 问 下 一 层 最 右边 的 结 点 


} 
} 


return WwW; 


} 

注意 ，while 循环 的 条 件 不 是 队列 非 空 ， 因 为 最 后 一 层 不 需要 遍历 ， 它 没有 孩子 层 。 

(3) 可 对 上 题 算法 修改 ， 每 一 层 结 点 的 层 数 都 相同 ， 某 一 层 遍历 完 后 层 数 加 1， 最 后 
一 层 的 层 数 即 树 的 高 度 ， 算 法 略 。 

另外 ， 也 可 用 一 个 数组 level[maxsize] 记 录 每 个 已 访问 结 点 的 层 数 ， 则 下 次 访问 其 孩子 
时 ， 孩 子 层 数 为 该 点 层 数 +1， 这 样 可 不 必 判 断 某 层 的 开始 和 结束 ， 算 法 如 下 : 


int high (bitree t) { // 层 序 壳 历 求 高 度 
pointer p,Q[Imaxsize]; // 队 列 


int front, rear; 
int level [maxsize],hmax,h; 
i1f (t==NUOLL}) return 0: 
hmax=0;front=rear=—1; 
reart++;Q[rear]=t;Level[rear]=1; // 根 结 点 入 队 , 根 层 数 为 1 
while (front!=rear) { // 队 列 非 空 ， 循 环 
front++;p=Q[front];h=level[front]; // 出 队 ， 访 问 队 头 
i1f (h>hmax) hmax=h; 
1if(p->lchild!=NULL) { 
rear++;Q[rear]=p->lchild;level [rear]=h+l; 


} 

if (p->rchild!=NULL) { 
rear++;Q[rear]=p->rchild;level[rear]=h+l; 

} 


} 
return hmax; 


} 


5.21 解 : 
(1) 注意 到 在 森林 (或 树 ) 对 应 的 二 又 树 中 ， 奉 某 结 点 没有 左 孩 子 〈 长 子 )， 则 其 为 叶 
子 ; 以 及 结 点 与 其 左 子 树 对 应 一 棵 树 ， 结 点 的 右 子 树 对 应 其 他 树 组 成 的 森林 ， 则 算法 如 下 : 


int leaf (bitree t) { // 求 森林 或 树 的 叶子 数 
F(t==NULDI Teturn 0s 
1f (t->lchild==NULL) return l+leaf (t->rchild); 
return leaf (t->lchild)+leaf (t—->rchild); 

} 


int high (bitree t) { // 求 森林 或 树 的 高 度 
int L,R; 
i (t=OLL) return 0 
L=l+high (t->lchild); // 第 一 棵 树 的 高 度 


R=high (t->rchild); // 其 他 树 组 成 的 森林 的 高 度 
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return L>R?2L:R; 


} 
(2) 在 森林 (或 树 ) 对 应 的 二 又 树 中 ， 结 点 与 其 右 护 子 ， 右 孩子 的 右 孩 子 ，…… ， 为 
同 层 结 点 ， 对 它们 可 依次 访问 。 下 一 层 的 结 点 依次 从 上 层 结 点 的 左 孩 子 开始 ， 同 样 沿 右 孩 
和子 搜 索 。 整 个 过 程 相当 于 对 二 叉 树 按 斜 右 下 的 方 问 层 序 过 历 。 对 每 个 结 点 ， 需 用 队列 记 住 
其 左 孩 子 以 便 下 一 层 过 历 。 算 法 如 下 : 
void level (bitree t) { // 层 序 遍 历 森 林 或 树 的 二 又 树 
ee // 队 列 ， 类 型 为 pointer 


1fF {t=s=sNULD) returns 
init sqqueue (&Q) ; 


en sqqueue (&Q,t); // 根 结 点 入 队 
while(!empty sqqueue (&Q) ) { 
de sqqueue (&Q, &p) // 出 队 


while(p!=NULL) { 
if(p->lchild!=NULL) en sqqueue (&Q,p->lchild); // 左 孩子 入 队 
cout<<p->data<<” “; 
p=p->rchild; // 回 右 搜索 
} 
} 
} 
_ . Gy 
5.22 解 : 对 任 一 棵 树 ， 表 示 父 子 和 兄 第 关系 是 显然 S 
的 。 如 果 还 要 表示 夫妻 关系 ， 可 对 树 施加 一 定 的 约束 ， 和 加 (加 
如 将 原 孩子 中 长 子 或 幼子 ) 的 位 置 表示 夫妻 ， 其 他 位 ”8 @) 吕 
置 表示 护 子 ， 见 右 图 (a); 与 该 图 相应 的 二 又 树 便 可 表示 
父子 、 兄 弟 、 夫 妻 三 种 关系 了 ， 见 右 图 (b)。 Ca) 可 Cb) 二 又 机 
5.23 解 : 判定 树 见 右 图 ， 相 应 的 算法 如 下 : 


char trans (float x) 1 


1f (x>=80) 
i1f (x>=90) return A’; 
else return "B's 


elae TFIXO=T70 retorn Es 
else if (x>=60) return ‘'D’; 
else return ‘E’; 
} 
平均 比较 次 数 n=0.05x3+0.15x3+0.4x2+0.3x2+0.1x2=2.2 
5.24 解 : 文件 每 合并 一 次 ， 其 中 的 每 个 记录 都 要 移动 一 次 ; 
即 合并 多 少 次 ， 有 关 的 记录 吏 要 移动 多 少 次 。 于 是 取 合并 的 次 数 
为 路 径 长 度 ， 每 个 文件 作 叶 子 ， 取 其 中 的 记录 数 作 权 构造 哈 夫 曼 
树 即 可 ， 结 果 如 右 图 所 示 。 


第 6 章 图 


6.1 解 : (1) 顶点 度 最 大 为 n-1 (无 问 图 ) 或 2(m-1) (有 向 图 ， 每 个 顶点 到 其 余 n-1 
个 顶点 都 可 有 一 条 入 边 和 出 边 )。 由 于 》 DCvi)=2e， 为 偶数 ， 所 以 度 为 奇数 的 点 只 能 是 偶 


数 个 《和 否则 奇数 个 奇数 的 和 仍 为 奇数 )。 
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(2) 设 顶 点 数 为 n、 边 数 为 e。 由 已 知 得 所 有 顶点 度数 之 和 > 三 2n; 由 于 每 条 边 有 两 个 
顶点 ， 又 可 得 所 有 顶点 度数 之 和 2e， 于 是 有 e 宇 n。 但 n 个 顶点 车 无 回 路 ， 则 最 多 n-1 


条 边 ， 即 生成 树 ， 超 过 n-1 条 边 后 肯定 出 现 回路 。 

6.2 解 : (1) 由 e 二 n(n-1)/2， 得 25x2 志 n(n-1)， 解 此 不 等 式 ， 得 n 三 7.39， 即 n 至 少 
为 8。 或 者 简单 试 凑 50 未 7(7-1)=42、50 三 8(8-1)=56 得 n 至 少 为 8。 

(2) 无 边 时 10 个 顶点 各 自 扳 立 ， 则 有 10 个 连通 分 量 ， 有 边 时 会 引起 连通 分 量 的 合 3 
而 减少 。 

Q) 连通 分 量 数 最 多 时 ， 由 5 条 边 合 并 的 连通 分 量 数 要 最 少 。 这 时 所 有 边 在 同一 个 连 
通 分 量 ， 且 其 中 顶点 数 尽 可 能 少 ， 也 即 尽量 接近 完全 图 。 对 5 条 边 ， 由 e 夺 n(n-1)/2， 得 连 
接 的 顶点 数 最 少 为 4 个 ， 还 剩 6 个 顶点 为 孤立 点 ， 故 最 多 有 1+6=7 个 连通 分 量 。 

@ 连通 分 量 数 最 少时 ， 由 5 条 边 合并 的 连通 分 量 数 要 最 多 。 这 时 每 条 边 使 两 个 连通 

分 量 合 二 为 一 ， 即 每 条 边 减 少 一 个 连通 分 量 ， 故 剩余 连通 分 量 数 =10-5=5 个 。 

6.3 解 : (1) 设 有 m 棵 树 ， 每 棵 树 的 顶点 有 Vi 个 ， 则 其 边 数 为 vi-1， 于 是 : 

VitVvzt***+Vvm—n 
(WI DP ewe 

两 式 相 减 可 得 m=n-e。 

(2) 注意 每 个 连通 分 量 对 应 一 棵 树 ， 利 用 上 题 结 果 有 e=n-m。 

6.4 解 : (1) 邻接 矩阵 为 上 三 角 和 矩阵 ， 则 任 一 顶点 的 邻 点 号 都 比 该 点 的 大 ， 故 从 任 一 


顶点 出 发 的 路 径 都 不 会 回 到 该 顶点 自己 ， 即 图 中 没有 回路 ， 故 可 以 拓扑 排序 。 
(2) 沿 拓扑 序列 对 顶点 重新 编号 ， 则 任 一 顶点 的 邻 点 号 都 比 该 点 的 大 ， 故 邻接 矩阵 为 


上 三 角 和 矩阵 (但 不 一 定 全 是 1， 不 存在 的 边 对 应 0)。 

6.5 解 ， 方 法 1: 对 该 图 进行 拓扑 排序 ， 夺 能 完成 则 无 回路 ， 否 则 有 回路 。 

方法 2: 对 该 图 进行 DFS 胃 历 ， 如 果 从 东 点 出 发 的 搜索 过 程 中 又 回 到 了 该 出 发 点 《〈 即 
迪 到 了 一 条 指 加 出 发 点 的 回 边 )， 则 有 回路 。 或 者 说 ， 如 条 从 任意 点 出 发 的 搜索 过 程 中 都 不 
会 回 到 出 发 点 ， 则 没有 回路 。 

6.6 解 : 邻接 表 上 求 出 度 方便 ， 但 求 入 度 不 方便 ， 从 而 求 度 也 不 方便 ， 邻 接 窍 阵 上 求 
出 度 和 入 上 度 部 方便 (看 相应 的 行 、 列 上 的 非 零 元 )。 所 以 用 邻接 矩阵 较 好 (其 他 几 个 运算 两 
者 都 方便 )。 

6.7 解 : 结果 见 下 图 所 示 。 


2) A 

1 si 
[3| js 

[D1 ef] 

(21 | dT 


邻接 表 


附录 A 参考 答案 


0 1 0 0 0 0 
0 0 0 0 0 0 
| 
] 0 0 0 0 1 - 9 
0 1 1 1 0 0 3 个 强 连 通 分 量 
邻接 矩阵 
6.8 解 : 由 于 是 无 向 图 ， 每 输入 1 条 边 要 在 邻接 表 上 建立 2 个 结 点 ， 用 头 插 法 建立 的 

邻接 表 如 下 图 所 示 : 
在 此 邻接 表 上 从 顶点 V2 出 发 的 DFS 遍历 序列 为 V2, V3, V6, Vs, V1, V4， BFS 遍历 序列 为 Vs, Va, 


V6, V1, Vs, V4o 

6.9 解 : 步骤 如 下 : 

(1) 从 任 一 顶点 出 发 按 出 边 方 回 进行 DFS 遍历 ， 并 按 其 所 有 邻接 点 的 过 历 都 完成 的 顺 
序 将 顶点 排列 起 来 。 

(2) 从 最 后 完成 届 历 的 项 点 出 发 按 入 边 方 问 进行 逆 癌 DFS 珊 历 ,大 不 能 访问 到 所 有 顶 

， 则 从 余下 的 顶点 中 最 后 完成 志 历 的 顶点 出 发 继续 作 逆 辐 DFS 明 历 ， 依 次 类 推 ， 直 到 所 
php diet Mbp 次 逆 问 DFS 壳 历 所 访问 到 的 顶点 集 便 是 有 问 图 的 一 个 强 连 
通 分 量 。 

6.10 解 : 求解 过 程 见 下 图 : 


2 Ls 0 0 0 0 
3 3 3 
Si 这 2 30 3 23 3 2 I3 a 2@ 23 
入 10 10 10 
A G ® 
Si a © 人 ev i 
12 12 
1 11 


SA OO 0 i Or YY- 国 1 图 .一 的 : 


(a) (b) Ce (d) (e) (f) 
6.11 解 : 欠 代 过 程 和 结果 见 下 图 : 
1 1 2 3 4 
lI~092 ll 234 
| 
co oo 0 0 ] 2 3 4 
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0 1 wm 4 1 2 3 4| 0;: 1>1 
al O92 | 2 3 | 1]: 1_>2 
3 4 0 7 ] 1 3 1 9。 1] 一 >7 一 >4 一 >3 
a 1 2 3 4| 3;: 1->2_>4 
0 1 103 1 2 2 2] 11: 2->4 >3->] 
-~092 1» ll 2 3 4| 0: 2>2 
2 3 4 056| ?| 13 1| 8 2 >4>3 
-0 1 2 3 4| 2: 2?->4 
0 1 103 1 2 2 2] 3: 3->1 
ll2092 3 2 3 4| 4: 3->1->2 
| 村 1 1| 
9 10 6 0 3 3 3 4| 6: 3->1->2_>4 
0 1 9 3 1] 2 2 2] 9: 4->3->] 
Il1 0 8 2 4 2 4 4| 10: 4->3->1->2 
M3 406 PM ll 13 | 6: 4->3 
9 1060 3 3 3 4| 0: 4->4 
6.12 解 : 


(1) 其 他 村 庄 到 某 村 庄 的 最 小 距离 对 应 距离 矩阵 的 各 列 。 由 As 可 见 , 取 4 号 村 庄 建 俱 
乐 部 较 好 ， 其 他 村 庄 到 它 的 距离 为 3, 2,6 (和 矩阵 第 4 列 )， 距 离 分 配 既 均匀 又 都 较 短 。 

(2) 某 村 庄 到 其 他 村 庄 的 最 小 距离 对 应 距离 矩阵 的 各 行 。 由 As 可 见 , 取 3 号 村 庄 建 俱 
乐 部 较 好 ， 它 到 其 他 村 庄 的 距离 为 3, 4, 6( 和 矩阵 第 3 行 )， 距 离 分 配 既 均匀 又 都 较 短 。 

(3) 考察 距离 矩阵 中 各 列 和 的 最 小 值 ， 分 别 为 23, 15, 23, 11， 故 取 4 号 村 庄 较 好 。 

(4) 考察 距离 矩阵 中 各 行 和 的 最 小 值 ， 分 别 为 13, 21, 13, 25， 故 取 1 号 或 3 号 村 庄 
较 好 。 

6.13 解 : 邻接 表 见 下 图 : 


用 栈 保 存 入 度 为 0 的 点 ， 则 有 多 个 入 度 为 0 的 点 时 输出 的 是 后 保存 的 点 ， 所 以 得 到 拓 
扑 排序 序列 为 : Via, Vi, V3, V2, Vs。 

用 队列 保存 入 度 为 0 的 点 ， 则 有 多 个 入 度 为 0 的 点 时 输出 的 是 先 保存 的 点 ， 所 以 得 到 
拓扑 排序 序列 为 : Vi, Va, Vz, va, Vs。 

6.14 解 : 

(1) 各 事件 的 最 早 发 生 时 间 : 


附录 A 参考 答案 XuA/ 


Ve (1)=0 

Ve (2)=Ve (1) +W12>=0+3=3 

Ve (3)=ve (1)+w1is=0+2=2 

ve (4)=max{ve (2)+Ww»4, Ve (3) +waa}=max{3+2,2+4}=6 

Ve (5)=ve (2)+Ww»cs=3+3=6 

ve (6)=max{ve (5) +wse, Ve (4) +Wwae, Ve (3) +wae}=max{6+1, 6+2,2+3}=8 


(2) 各 事件 的 最 晚 发 生 时 间 : 


Vl1(6)=ve (6)=8 

V1 (5)=v1 (6)—wse=8—1=7 

V1 (4)=v1 (6) _wse=8-2=6 

V1 (3)=min{vil (4)—waa, V1 (6)—wae}=min{6-4,8-3}=2 
V1 (2)=min{vl (5)—w»s, V1 (4)—w4}=min{7—-3,6-2}=4 
V1 (1)=min{vil (2)—wi2, V1 (3)—wi3}=min{4-1,2-2}=0 


(3) 各 活动 的 最 早 开始 时 间 e、 最 人 运 开 始 时 间 1， 以 及 时 间 余 量 如 下 表 所 示 ， 关 键 路 和 
如 下 图 实 线 所 示 。 


6.15 解 : 先 建立 顶点 表 ， 然 后 依次 读 入 边 <i, j>， 对 每 条 边 生成 1 个 边 表 结 点 ， 其 no 
域 为 1， 将 它 插入 到 第 j 个 边 表 中 。 采 用 头 插 法 。 在 项 点 对 输入 过 程 中 ， 目 动 累计 边 数 ， 硅 
输入 的 顶点 号 1<0 则 结束 。 算 法 如 下 : 


void creatgraph (lk graph *ga) { 
int i,J,n,e; 
pointer p; 


cin>>n; // 读 入 顶点 数 
ga—>n=n; 
for (i=1;i<=n;i++) {  // 读 入 顶点 信息 ， 建 立 顶 点 表 


cin>>ga->ad]jlist[i] .data; 
ga—>ad]jJlist[1i] .first=NULL; 
} 


e=0; 

while (cin>>i>>j,i>0) {// 读 入 边 ， 建 立 边 表 
= / /累计 边 数 
p=new node; // 生 成 邻接 点 序号 为 i 的 表 结 点 
p—>no=1; 


p—->next=ga—>ad]jlist[]j] .first; 
ga_>adjlist[j] .first=p;// 将 新 表 结 点 插入 到 顶点 vj 的 边 表 头 部 


} 
ga—>e=e; 
} 
6.16 解 : 由 于 要 求 邻接 表 中 的 结 点 按 项 点 序号 的 大 小 顺序 排列 ， 所 以 在 邻接 矩阵 某 行 


上 求 邻 接点 时 ， 如 条 是 从 左 回 右 扫描 ， 则 要 用 尾 插 法 建 邻接 表 :， 如 果 是 从 右 问 左 扫描 ， 则 
要 用 头 插 法 建 邻 接 表 。 以 后 者 为 例 ， 算 法 如 下 : 


Vold mattolist (mat graph *gm,lk graph *gl) { 
和 
pointer p; 
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gl1—>n=gm->n;9gl1->e=gm-—>e; 
for (i1=1;1<=gl—>n;1i++) gl—->ad]jlist[i] .first=NULL; 
for (i=1;i<=gm-—>n;1i++) 
for (J=gm—>n;]J]>=1;]-——) { 

if (gm->adjmat [i] []]==0) continue; 

p=new node; // 生 成 邻 点 

p->no=]; // 插 入 到 表 头 

P->next=gq1->adq]j1lLlist[1I].flrst; 

gl—>adjlist[1i] .first=p; 


} 
6.17 解 : 这 里 需要 将 访问 过 的 顶点 入 栈 。 假 设 图 以 邻接 表 表 示 ， 算 法 如 下 : 


void dfsL(lk graph *g,int v) { // 邻 接 表 DFS 遍历 , 非 递 归 
int S [nmax] ,top:; // 栈 
pointer p; 
top=—1; 
cout<<v<<” "ijvisited[v]=1; ”// 访 问 出 发 点 ， 假 设 为 输出 项 点 序号 
SL[++top]=v; 
while (top!=—1) { 
p=g—>adjlist[S[top]] .first; 
while(p!=NULL && visited[p->no]) p=p->next;// 搜 索 栈 顶 未 访问 的 一 个 邻接 点 


if (p==NULL) top——; // 退 到 前 一 个 顶点 
else { 
cout<<p->no<<” “;visited[p->no]=1; // 访 问 出 发 点 


S[++top]=p->no; 
} 
} 
} 


6.18 解 : 
(1) 假设 有 问 图 以 邻接 表 表示 。 从 vi 出 发 进行 非 递 归 DFS 过 历 〈 将 访问 过 的 顶点 入 栈 )， 
耕 衣 历 中 直到 顶点 Vj， 则 顶点 Vi 到 vi 有 路 人 符 ， 此 时 栈 内 的 项 点 序列 即 为 路 和 任 。 算 法 如 下 : 


int pathdetect (lk graph *g,int 1,int ]) { 
int S[nmax],top; // 栈 
3 Es 
pointer p; 
top=—1; 
vi19Sltedl1]=1: 
S[++top]=i; 
while(top!=—1) { 
p=g—->adjlist[SsS[top]] .first; 
while (p!=NULL && visited[p->no]) p=p->next;// 搜 索 栈 项 未 访问 的 一 个 邻接 点 
1f (p==NULL) top——; 
else { 
visited[p->no]=1; 
S[++top]=p->no; 
if (p->no==]) { // 搜 索 到 vi; 
cout<<7 发 现 路 径 : \n”; 
for (k=0; k<=top; k++) cout<<S[k]<<” “; 
return 1; 
} 
} 


} 
cout<<“ 没 有 路 径 : \n”; 
return 0; / /始终 没有 搜索 到 v; 
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(2) 可 在 (1) 的 基础 上 修改 ， 即 每 搜索 到 一 个 结 点 ， 束 检测 路 笃 上 的 结 点 总 数 〈 即 
top) 是 人 耕 等 于 图 的 结 点 总 数 g->n。 这 里 没有 指定 出 发 点 ， 可 依次 从 每 个 结 点 出 发 进行 上 
述 算法 ， 上 具体 算法 略 。 

6.19 解 : 


(1) 本 题 与 上 题 (1) 类 似 ， 但 这 里 访问 出 发 点 v 后 不 能 将 其 访问 标志 置 1， 否 则 以 后 
搜索 未 访问 的 邻接 点 时 不 可 能 再 找到 v。 算 法 如 下 : 


int pathdqetect3 (lk graph *g,int v) { 
int S[nmax],top; // 栈 
LE js 
pointer p; 
top=—1; 
S[++top]=v; 
whlle (top!=-1) { 
p=g->ad]jlist[s[top]].first:; 
while (p!I=NULL && Visited[p->no]l) p=p->next;// 搜 索 栈 项 未 访问 的 一 个 邻接 点 
if (p==NULL) top——; 
else { 
visited[p->no]=1; 
Sl++top]=p->no; 
if (p->no==V) { // 搜 索 到 
cout<<” 发 现 回 路 : \n”; 
for (k=0; k<=top; k++) cout<<S[k]<<” “; 
return 1; 
} 
} 
} 
cout<<“ 没 有 回路 : \n”; 
return 0; / /始终 没有 搜索 到 v; 
} 


(2) 可 在 (1) 的 基础 上 修改 ， 即 当 出 现 回 路 时 ， 检 测 路 径 上 的 结 点 总 数 〈 即 tptp) 是 
否 等 于 图 的 结 点 总 数 g->n。 这 里 没有 指定 出 发 点 ， 可 依次 从 每 个 结 点 出 发 进行 上 述 算法 ， 
具体 算法 略 。 

6.20 解 : 

(1) 采用 BFS 遍历 ,距离 顶点 v 层 数 为 len+l 的 顶点 就 是 最 短路 径 长 度 为 len 的 顶点 。 
裔 历 中 保存 各 点 的 层 数 ， 以 便 求 其 邻接 点 的 层 数 (为 该 点 层 数 +1)。 以 邻接 表 为 例 ， 算 法 
如 下 : 


void search(lk graph *g,int v,int len) { 
sqqueue 0Q1,0Q2; // 假 设 采 用 顺序 队列 ， 分 别 保存 访问 的 顶点 号 及 其 层 数 
pointer p; 
int level; 
init sqqueue (&Q1);init sqqueue (&Q2); 
visited[v]=l1;level=1; 
en sqqueue (&Q1,v) ;en sqqueue (&Q02,1evel); 
while(!empty sqqueue (&Q1) && level<len+l1) { 
de sqqueue(&Q1,&Vv) ;de sqqueue(&Q2,&level); 
p=g—>ad]jlistl[v] .first; 


4 数据 结构 教程 与 题解 


leveltt+; 
while(p!=NULL) { 
if(!visited[p->no]) { 
if (level==len+1) cout<<p->no<<” “; 
visited[p->no]=1; 
en sqqueue (&Q1,p->no);ien sqqueue (&Q2,1evel); 
} 
p=p—>next; 
} 
} 
} 


(2) 可 在 (1) 的 基础 上 修改 ， 即 这 些 顶 点 就 是 最 后 一 层 上 的 所 有 结 点 。 算 法 略 。 
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7.1 略 

7.2 略 

7.3 略 

7.4 略 

7.5 解 : 已 知 叶子 数 的 完全 二 又 树 一 般 有 两 里 〈 见 习题 5.9)， 所 以 树 形 选 择 排序 也 可 
有 两 种 可 能 ， 其 中 最 底层 的 叶子 数 分 别 为 偶数 和 奇数 ， 但 后 一 种 在 两 两 比较 时 有 一 个 叶子 
轮空 直接 进入 上 一 层 ， 故 实际 上 只 需 考虑 前 一 种 情况 。 有 具体 结果 见 如 下 示意 图 。 


@ 
《c) n=6 (d) n=7 

7.6 解 : 在 n 个 数据 中 找 最 小 的 ， 任 何 基于 比较 的 排序 方法 至 少 需要 作 n-1 次 比较 。 
为 使 找 次 小 时 比较 次 数 最 少 ， 就 要 充分 利用 前 一 次 比较 的 结果 ， 这 可 用 二 叉 树 将 前 一 次 比 
较 的 结果 记录 下 来 。 故 采用 树 形 选择 排序 。 它 在 选 出 最 小 后 ， 以 后 各 趟 只 需 比较 | log,n | 
次 。 所 以 本 问题 总 的 比较 次 数 为 mn-1H log,n 上 1 009。 但 这 个 结果 中 有 一 次 是 与 +ce 比 较 ， 
是 不 必要 的 ， 所 以 上 述 结果 应 减 1。 另 外 ，1 000 个 结 点 的 完全 二 又 树 不 是 满 二 又 树 ， 最 小 
叶子 可 能 不 在 最 底层 而 在 倒数 第 二 层 ,这 时 上 述 结果 应 再 减 1。 所 以 最 少 比较 次 数 为 1009-1 
或 1009-2〈 取 决 于 数据 分 布 情况 )。 

7.7 解 : 小 根 堆 中 最 大 者 只 可 能 是 叶子 , 1 000 个 结 点 的 堆 有 500 个 叶子 , 找 其 中 最 大 ， 
至 少 比较 $00-1 次 。 
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7.8 解 : 

方法 1: 用 快速 排序 , 每 趟 划分 后 检查 基准 位 置 1(〈 它 就 是 其 最 终 位 置 )， 知 二 s 或 s+1， 
则 基准 左 侧 即 为 所 求 ; 若 i>st1 或 i<s， 再 对 左 序列 或 右 序 列 继续 划分 。 

方法 2: 用 堆 排 序 ， 建 立 初始 小 根 堆 后 ， 进 行 s-1 次 重建 和 调整 。 

方法 3: 用 冒 泡 排序 (上升 法 )， 进 行 s 趟 ， 得 到 s 个 最 小 。 

方法 4: 用 直接 选择 排序 ， 进 行 s 未 ， 选 出 s 个 最 小 。 

7.9 解 : 以 读本 的 划分 算法 2 为 例 : 从 右 问 左 扫 摘 ， 若 有 交换 则 改变 方 癌 ， 从 左 问 右 
扫描 ， 大 有 交换 再 改变 方 同 ，…… 

(1) 每 个 关键 字 都 移动 一 次 ， 则 关键 字 中 后 面 的 都 比 基 准 小 ， 前 面 的 都 比 基 准 大 。 

对 7 个 关键 字 ， 除 基准 外 还 有 6 个 ， 故 比 基 准 小 和 比 基 准 大 的 各 3 个 ， 比 如 4, 5, 6, 7， 
1, 2, 3， 移 动 次 数 =6+2=8， 其 中 基准 移动 2 次 : 划分 开始 移 走 、 结 束 时 移 回 。 

对 8 个 关键 字 ， 除 基准 外 还 有 7 个 ， 由 于 先 从 右 癌 左 扫 描 ， 故 比 基 准 小 的 有 4 个 ， 比 
基准 大 的 有 3 个 ， 比 如 $. 6, 7, 8, 1, 2, 3, 4， 移 动 次 数 =7+2=9。 

(2) 移动 次 数 最 少 ， 需 划分 趟 数 最 少 ， 且 每 趟 的 移动 最 少 。 前 者 要 求 每 趟 得 到 两 个 等 
长 区 间 ， 即 基准 位 于 中 间 位 置 ， 则 该 位 置 原 来 的 元 素 必 定 和 基准 交换 一 次 ; 后 者 要 求 其 他 
元 素 不 发 生 交 换 。 所 以 中 间 位 置 后 的 元 素 比 基准 大 ， 前 面 的 比 基 准 小 ， 划 分 后 的 区 间 有 同 
样 要 求 。 比 如 序列 4, 1, 3, 2, 6, 5, 7。 共 划分 2 趟 ， 出 现 3 个 基准 ， 与 此 对 应 有 3 次 元 素 移 
动 ， 而 每 个 基准 移动 2 次 ， 故 总 的 移动 次 数 为 3+3x2=9。 

(3) 比较 次 数 最 少 即 最 好 情况 ， 每 趟 划分 得 两 个 等 长 区 间 。 当 n=7 时 ， 第 一 趟 划分 时 
比较 6 次 ， 得 两 个 区 间 ， 长 度 各 为 3。 第 二 趟 划分 时 ， 两 个 区 间 各 比较 2 次 ， 分 别 得 两 个 
长 度 为 1 的 区 间 ， 排 序 结束 。 总 共 比 较 了 6+2x2=10 次 ， 比 如 序列 4, 7, 5, 6. 3, 1, 2。 

(4) 比较 次 数 最 多 即 最 坏 情 况 ， 每 趟 划分 后 一 个 区 间 长 度 为 0， 男 一 个 长 度 为 原 区 间 
长 度 减 1。 当 原 序列 有 序 时 ， 出 现 这 种 情况 。 当 n=7 时 ， 总 比较 次 数 为 6+5+4+3+2+1=21， 
比如 序列 7，6, 5, 4, 3, 2, 1 或 1,2,3,4,5,6,7。 

(5) 任何 基于 比较 的 排序 ， 最 坏 情 况 下 关键 字 的 比较 最 少 | log,(nl) | 次 。 

注意 ， 这 个 下 界 可 能 是 达 不 到 的 ， 如 n=12 时 ，| log,(12!) F29， 有 人 用 穷 举 法 在 计算 
机 上 证 明 不 可 能 用 29 次 比较 来 完成 12 个 数 的 排序 ， 实 际 最 优 方案 至 少 需要 30 次 比较 。 

7.10 解 : 对 于 快速 排序 的 平均 性 能 ， 要 考虑 每 次 划分 后 基准 出 现在 各 种 位 置 上 的 情 
况 。 假 设 基准 在 每 个 位 置 上 出 现 的 概率 是 相同 的 。 硅 基准 的 位 置 为 k (k=1, 2,…, n)， 则 
划分 后 两 个 区 间 长 度 分 别 为 k-1 和 n-k， 于 是 平均 比较 次 数 为 : 

cm=a-1+=> [ck-D+ca- (azD ， 其 中 Co=0, Ci=-0. Cs=1,… 
k=1 


其 中 9-1 为 n 个 数据 划分 时 的 比较 次 数 。 注意 到 Ck 一 1) 和 CQ -lo 实际 上 是 相等 的 ， 
k=1 k=1 


因为 一 个 从 C(0) 累 加 到 Cao-1D)， 另 一 个 从 C(n--1) 累 加 到 C(0)， 所 以 : 
C(n) = 也 一 1 十 25 cd (n>1) 
nN k=0 


其 通 式 为 ( 见 附录 E): 
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C(n)=2(n+1)In(n +1)+ O(n) 
~ 2nln(n) zs1.3%nlog,n = O(nlog,n) 
记录 移动 次 数 不 大 于 比较 的 次 数 ， 故 快速 排序 的 平均 时 间 复 林 拔 为 O(nlog,n )。 
7.11 解 : 算法 如 下 : 


void InsertSort2 (11st R,int n) { 
int 1,],low,high,mid; 


for(1i=2;1i<=n;1i++) { // 依 次 插入 R[2],R[3],…,R[n] 
if (RI[i] .key>=R[i-1] .key) continue;//R[i] 大 于 有 序 区 最 后 一 个 记录 ， 不 青 插 入 
R[0]=R[1]; 
low=1;high=1i-—1; 
while (low<=high) { // 食 找 R[i] 的 插入 位 置 


mid= (low+high) /2; 
1f(R[0] .key<R[mid] .key) high=mid-—1; 


else low=mid+1; 
} 
for (J=1i-—1;]>=mid;]——) 

R[J+1]=R[J]; // 记 录 后 移 
R[Imid]=R[0]; // 插 入 RI[i] 


} 
} 


7.12 解 : 采用 监视 哨 时 ， 每 组 都 需 一 个 监视 哨 。 设 当前 增 量 为 hb， 则 数据 表 分 为 hn 组: 
(Ri Rinh, Ritzh，…)， 过 1, 2,…, h， 由 于 组 内 记录 间 下 标 相 差 h， 则 各 组 监视 哨 的 位 置 分 别 
为 1-h, 2-h,…, 0。 这 些 位 置 越 出 了 数组 下 标 范 围 ， 需 要 移动 数据 表 ， 处 理 起 来 不 方便 。 

为 此 ， 对 算法 作 个 变形 , 将 分 组 和 排序 都 从 右 回 左 进行 ， 这 时 分 组 情况 为 : (…, Rao 2h， 
Ra i_h, Ra i)， 二 0, 1 …,h-1， 则 每 组 监视 哨 的 位 置 为 n-ith， 它 们 处 于 数据 表 的 右 靖 ， 这 只 
要 在 数组 上 端 预 留 一 定 空间 即 可 。 上 有 具体 算 法 如 下 : 

void ShellInsert (list R, int n,int h) {// 一 趟 插入 排序 ， 从 右 问 左 进行 ，h 为 本 趟 增 量 


1 


for (i=0;i<h;i++) { //i 为 组 号 
for (j=n-—i—h;]j>=1;j-=h) { // 每 组 从 右 第 2 个 记录 开始 插入 ， 它 的 下 标 为 n-i-h 
R[n-i+h]=R[j]; // 监 视 哨 
k=j+h; // 待 插 记 录 的 后 一 个 记录 
while (R[n-i+h] .key>R[k] .key) {// 碍 找 正 确 的 插入 位 置 
R[k-h]=RI[kK]; // 前 移 记 录 
k=k+h; // 回 后 搜索 
} 
R[k-h]=R[n-i+th]; // 插 入 R[j] 
} 


} 
} 


7.13 解 : 双 回 扫描 时 区 间 的 两 个 端点 都 在 变化 ， 且 任 一 个 扫描 方 癌 大 没 有 发 生 交 换 惑 
可 结束 。 算 法 如 下 : 
void BubbleSort2(1list R,int n) {// 双 向 冒 泡 排序 
nt 3 . ETlags 
A / /扫描 区 间 


while(1<]) { 
EL // 置 未 交换 标志 
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for (k=j]; k>=i+1; k——) // 从 下 同上 扫描 
if(R[k] .key<R[k-1] .key) { // 交 换 记 录 
flag=1; 
R[0]=R[K] ;R[K]=R[k-1] ;R[kK-1]=R[0]; // 交 换 ，R[0] 作 辅助 量 
} 
if(!flag) break; // 本 趟 未 交换 过 记录 ， 排 序 结束 
了 二 // 扫 描 区 间 缩 短 
flag=0; // 置 未 交换 标志 
for (Kk=i; kK<=j—1; k++) // 从 上 问 下 扫描 
if(R[k] .key>R[k+1] .key) { // 交 换 记 录 
flag=1; 
R[0]=R[K] ;R[kK]=R[kK+1] ;R[K+1]=R[0]; // 人 交换 ，R[0] 作 辅助 量 
} 
if(!flag) break; // 本 趟 未 交换 过 记录 ， 排 序 结束 
// 扫 描 区 间 缩 短 
} 
} 
7.14 解 : 


(1) 由 于 是 单 链表 , 在 有 序 区 中 寻找 插入 位 置 时 只 能 从 前 问 后 进行 。 设 链表 有 头 结 点 ， 
有 序 区 尾 结 点 位 置 为 rear， 算 法 如 下 。 


Vold InsertSort2 (lklist head) f{ 
pointer s,t,p,rear; 
if (head->next==NULL) return; // 链 表 为 空 


rear=head-—>next; // 第 一 点 为 初始 有 序 区 

while (rear->next!=NULL) 1{ // 无 序 区 非 空 ， 循 环 
pP=Trear->next:; /VPp 为 无 序 区 第 一 点 
Ss=head; 


t=s—>next; 
while(t—->data<=p->data && t!=p) { 
// 从 有 序 区 第 一 点 开始 ， 寻 找 插 入 位 置 t，s 为 其 前 趋 
Ss=t ;t=t-—->next; 
} 
if (t==p) rear=p; // 位 置 无 需 移 动 
else {rear->next=p->next;s->next=p;p->next=t;} // 插 入 
} 
} 


易 见 ， 该 算法 是 稳定 的 。 但 铬 把 内 层 循 环 条 件 中 的 “<=” 改 为 “<”， 则 是 不 稳定 的 。 
(2) 设 链表 有 头 结 点 ， 有 序 区 尾 结 点 位 置 为 rear。 


Vold SelectSort2 (1K1L1st head) 1{ 
pointer s,t,q,p,rear; 


rear—head; / /初始 有 序 区 为 空 

while (rear—->next!=NULL) { // 无 序 区 非 空 ， 循 环 
q=rear;p=q->next; //P 为 最 小 值 点 ， 初 值 为 无 序 区 第 一 点 (9 为 其 前 趋 ) 
s=p;t=s->next; //t 为 搜索 点 ， 从 无 序 区 第 二 点 开始 (s 为 其 前 趋 ) 
while(t!=NULL) { // 寻 找 最 小 点 


1fE (七 ->dqata<p->qata) {q=s7p=t7 } 
s=t; t=t-—>next; 
} 
q—>next=p->next; // 最 小 点 插入 到 有 序 区 尾部 
p—>next=rear—>next 
rear—>next=p; 
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rear=p; 
} 

} 

易 见 ， 该 算法 是 稳定 的 。 注 意 算 法 不 是 将 找到 的 无 序 区 最 小 点 与 无 序 区 的 第 一 点 交换 
(就 像 顺序 存储 时 那样 ， 其 结果 是 不 稳定 的 )， 因 为 链表 上 物理 交换 不 如 改 指 针 方便 。 

(3) 从 前 问 后 扫描 并 比较 相 邻 两 结 点 ， 在 位 置 不 对 而 进行 交换 时 修改 指针 关系 ， 而 不 
真正 物理 交换 ， 具 体 算法 略 。 

7.15 解 : 这 是 一 个 三 路 划分 问题 ， 可 在 快速 排序 的 二 路 划分 基础 上 改 。 以 单 癌 扫描 为 
例 ， 设 扫描 过 的 数据 分 成 负 值 区 、 和 零 值 区 和 正 值 区 ， 其 中 零 值 区 首 末 位 置 为 s、t， 当 前 扫 
描 位 置 为 1。 预先 取出 R[II]， 裕 出 位 置 t。 夯 RD] 比 雪 大 ， 已 在 正 什 区， 继续 ;看 等 于 雪 ， 
则 存 到 原 t 处 ， 并 把 原 R[t+l] 移 到 1 处 ， 空 出 针 ]1 位 置 ， 零 值 区 增 大 一 位 ; 辱 为 负数 ， 则 把 
原 R[s] 移 到 t 处 ， 把 RD] 存 到 s 处 ， 原 R[ttl] 移 到 i 处 ， 空 出 tt]1 位 置 ， 零 值 区 整体 后 移 一 
位 。 最 后 把 原 R[I1] 放 到 适当 位 置 。 显 然 复杂 性 为 O(n)。 算 法 如 下 : 

int way3(list R,int n) 1{ /7/ 三 路 划分 , 单 问 扫描 ， 返 回 堆 值 区 首位 置 


WE Ry 


rectype x; // 辅 助 量 (可 用 Rr[I0] 代 符 ) 
1f{(n<=1}) return; 

s=t=1; //s,t 等 值 区 始末 端 

x=R[1]; // 始 终 空 出 位 置 t, 最 初 即 RI[1] 


for(i=2;1i<=n;1i++) { 
if (R[i] .key>0) continue; 
else if (R[i] .key==0) {RI[t]=R[1i1];R[1i]=RI[t+1] ;t++;} 
else {R[t]=R[S];R[S]=R[1i1];R[1i]=R[t+1] ;t++; S++;} 

} 

1f (x.key>=0) RI[t]=x; 

else {RI[t]=R[S] ;RI[S]=x;S++;} 

return s; 

} 


采用 双 癌 扫 拉 时， 可 在 划分 过 程 中 ， 左 侧 等 于 去 的 数 先 放 到 区 间 左 站 右 侧 等 于 零 的 
数 先 放 到 区 间 右 病 ， 划 分 完 后 再 将 前 后 两 端的 零 值 区 交换 到 区 间 中 间 位 置 。 具 体 算 法 略 。 

7.16 解 : 

划分 算法 1: 交 符 扫描 ， 从 后 同 前 找 比 基准 小 的 记录 ， 有 再 从 衣 问 后 找 比 基准 大 的 记录 ， 
两 者 交换 。 于 是 将 基准 右边 的 区 间 Rfp+1] 一 R[q] 分 成 两 部 分 ， 左 部 分 三 基准 ， 右 部 分 三 基 
准 ; 然后 将 基准 和 左 部 分 的 最 后 一 个 交换 便 得 到 划分 结果 。 算 法 如 下 : 

int Partition 1(list R,int p,int q) {// 对 RI[p]~R[9q] 划 分 ， 返回 基准 位 置 ， 双 癌 扫 描 


int 1,]; 

rectype x,y; 

i=p+1; j=q; x=R[p]; //X 存 基准 (无 序 区 第 一 个 记录 ) 
do { 


while(i<j && R[j] .key>x.key) j--;// 在 右 侧 找 <=x 的 元 素 
while (i<] && RI[i] .key<x.Kkey) i++;// 在 左 侧 找 >=xzx 的 元 素 

if (i>=j]) break; // 示 发现 交 换 对 象 
y=R[jJ];?R[jJ]=R[i1] ;RI[1i]=y;1i++;]-—-—; 

while (1); 

if(i==] && R[j] .key>x.key) j--; // i=j 时 未 检测 ， 调 整 基准 位 置 
R[p]=R[j];R[j]=x; 

return jJ; 


一 一 
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划分 算法 3: 单 问 扫 朱 ， 使 扫描 过 的 数据 分 成 小 什 区 和 大 等 值 区 。 设 当前 小 值 区 末 位 
置 为 s〈( 大 等 值 区 首位 置 为 st1)， 当 前 扫 拉 位置 为 RD。 帮 了 RD] 比 基 准 小 , 则 把 它 与 RIs+1] 
交换 ， 这 时 小 值 区 扩大 一 位 ，s++; 否则 大 等 值 区 目 动 扩大 一 位 。 算 法 如 下 : 

int Partition 3(list R,int p,int q) {V/ 对 RIp]~RId] 划 分 ， 返 回 基准 位 置 ， 单 回 扫 摘 


工区 下 一 二 
rectype x,y; //Yy 辅助 交换 
s=p; x=R{[p]; //X 存 基准 (无 序 区 第 一 个 记录 ) 


for(i=p+1l;1i<=q;1i++) { 
1f (R[i] .key>=x.key) continue; 
st++;y=R[s];R[s]=R[i] ;RI[i]=y; 
} 
RIp]=RIS] ;RIS]=x; / /基准 移 到 最 终 位 置 
return s; 


} 

7.17 解 : 将 快速 排序 的 递归 算法 改 成 非 递归 算法 ， 需 要 引进 一 个 栈 ， 最 多 不 超过 mn， 
如 果 每 次 都 选 较 大 的 部 分 进 栈 ， 处 理 较 短 的 部 分 ， 递 归 深度 可 降低 到 O(logn)。 进 一 步 ， 
并 不 需要 将 子 序列 本 身 入 栈 ， 只 要 将 其 边界 入 栈 即 可 。 算 法 如 下 : 


Vold QuickSort2(1ist R,int n) { 


int s[maxsize*2]; //maxsize>logzn+l, 栈 空间 〈 太 大 时 用 动态 申请 和 释放 ) 
用 (否则 系统 内 部 栈 会 淤 出 ) 
top=—1; 

s[++top]=1; // 预 入 栈 〈 子 序列 的 2 个 边界 端点 ) 


s[++top]=n; 
while (top!=—1) { 
J]=s [top——]; 
1=s [top——]; 
while(1<]) { 
k=Partition(R,i,j); 
Tet ed // 后 部 较 大 ， 进 栈 。 分 划 前 部 
Ss[++top]=k+1; 
s[++top]=]; 
J]=k—1; 
} 
else { // 前 部 较 大 ， 进 栈 。 分 划 后 部 
s[++top]=i; 
号 [LOD] 三 开工 : 
i=k+1; 
} 
} 
} 
} 


易 见 ， 将 栈 改 为 队列 也 可 ， 因 为 快速 排序 本 喘 并 不 要 求 先 对 哪个 子 序列 进行 划分 。 

7.18 解 : 

自 顶 癌 下 的 三 路 归并 排序 是 一 种 “分 治 法 ”， 先 将 区 间 分 成 长 度 相 当 的 前 后 两 部 分 
R[1] 一 人 mid]、R[mid+l] 一 人 R[high]， 各 目 排 序 后 得 到 两 个 有 序 区 间 ， 上 再 将 两 者 归并 。 而 前 
后 两 个 有 序 区 间 的 获得 〈 排 序 ) 是 用 同样 的 方法 : 对 各 目的 前 后 两 部 分 排序 ， 再 归并 。 这 
个 过 程 是 递归 的 ， 很 容易 用 递归 实现 ， 算 法 如 下 : 
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Vold MergeSort2(1ist R,1ist R1,Int n,int low,int high) { 
// 对 RR 二 路 归并 排序 (递归 算法 ) 
int mid; 
1if (low>=high) return; 
mid= (low+high) /2; 
MergeSort2 (R,R]1,n,1ow,mid); 
MergeSort2 (R,R]1,n,mid+l, high); 
Mergqe2 (R,R1,1ow,mid,high); 
} 
但 递归 中 不 能 交 蔡 使 用 Rl1 和 及 作 辅 助 空 间 ， 故 Merge2 归并 后 的 结果 仍 要 在 原 及 中 ， 
这 可 在 归并 前 将 数据 从 RR 复制 到 Rl 中 (或 归并 后 将 数据 从 Rl 复制 到 及 中): 
void Merge2 (list R,1ist Ril,int low,int mid,int high) { 
// 合 并 R 的 两 个 子 表 ， 结 果 在 R 中 
了 二 工 了 了 
for (i=low; i<=high;i++) // 子 序列 复制 到 R1 
R1[1]=R[1]; 
1=]ow; J]=mid+1; k=l]ow; 
while(1i<=mid && J]J<=high) 
if (Rl1[i] .key<=R1[j] .key) R[k++]=R1 [i++]; // 取 小 者 复制 
else RI[k++]=R1 [j++]; 
while(i<=mid) R[k++]=R1[i++]; // 复 制 左 子 序列 的 剩余 记录 
while (j<=high) R[k++]=R1[j++]; ”// 复 制 右 子 序列 的 剩余 记录 
} 
该 算法 尚 可 改进 : 在 子 序列 复制 时 ， 先 将 第 二 个 子 序 列 逆 置 ， 于 是 合并 时 ， 两 个 子 序 
列 从 两 站 问 中 间 推 进 ， 推 进 冰 互相 成 为 另 一 哨 的 “监视 哨 ?， 这 样 承 不 必 检 得 共 个 子 序列 是 
合 先 处 理 完 的 情况 了 。 算 法 如 下 : 
Vold Merge2 (list R,11st R1,Int low,int mid,int high) { 
// 合 并 RR 的 两 个 子 表 ， 结 果 在 R 中， 市 监视 哨 技术 
工人 
for (i=low; i<=mid;i++) R1l[i]=R[i];// 左 子 序列 复制 到 R1 
1=mid+1;]=high; 
while(i<=high) R1[jJ--]=R[i++]; // 右 子 序列 逆 置 复制 到 R1 
1=]ow; J]=high; k=low; 
while (1<=]) 
1f (Rl1[i] .key<=R1[]J] .key) RI[k++]=R1 [i++]; 
else RI[k++]=R1 [Jj--—]; 
} 
注意 ,对 非 递 归 的 二 路 归并 ， 由 于 归并 前 不 需要 将 数据 先 复 制 到 Rl1( 奇 未 和 贫 赵 归并 
交替 用 R1 和 R 作 辅 助 空 间 )， 不 能 采用 上 述 “ 监 视 哨 ”技术 。 
易 见 递归 算法 比 非 递 归 算 法 年 洁 些 (不 用 区 分 子 表 个 数 为 奇数 、 个 数 或 最 后 子 表 较 短 
等 情况 )。 与 快速 排序 相 比 ， 递 归 归 并 排序 在 对 问题 “分 解 ”， 即 划分 子 区 间 时 比较 容易 ， 
但 在 “组 合 ”， 即 合并 子 区 间 时 比较 困难 。 
上 述 归 并 排序 算法 的 时 间 复 杂 上 度 可 递归 地 表示 如 下 : 
T(n)=2T(n/2)+n ， T(1)=c 
其 中 T(w2) 表 示 归 并 长 度 为 m2 的 子 表 的 时 间 , n 表示 归并 两 个 子 表 的 时 间 。 为 简单 起 
见 ， 假 设 表 的 长 度 为 2 的 乘 方 ，n=2*， 则 与 推导 快速 排序 最 好 情况 下 的 比较 次 数 类 似 ， 从 
递归 方程 式 可 推出 T(n)=O(nlog,n )， 即 时 间 复 杂 度 与 非 人 递归 算 法 相当 。 


附录 A 参考 答案 CA 


但 递归 时 递归 栈 引 起 附加 时 衬 开 销 ， 加 上 归并 前 数据 预 复制 的 开销 ， 所 以 实际 执行 效 
率 闻 不 及 非 递 归 算 法 。 

7.19 解 : 

(1) 将 新 增加 的 最 后 一 个 关键 字 与 其 双亲 、 双 杀 的 双亲 等 进行 比较 ， 直 到 根 和 逐步 进行 
调整 ， 算 法 如 下 : 


while(i>=1 && x>k[1]) { 
K[J]=kK[1]; 
] 一 17 
1=]/2; 
} 
kK[J]]=x; 
} 
该 算法 也 可 用 k[0] 作 监视 哨 ， 即 循环 开始 前 使 k[0]=k[n]， 则 循环 条 件 为 k[0]>k[i]。 
(2) 建 大 根 堆 的 过 程 就 是 在 已 有 堆 上 不 断 插入 ， 算 法 如 下 : 
void build(keytype keyl[l],int n) { 
int 1; 
for(i=1;i<=n;i++) { 
cin>>key[i]; 
adjust (key, 1); 
} 
} 
(3) 当 第 i 个 结 点 插入 时 ， 二 又 树 当 前 结 点 数 为 i， 高 度 为 | log,i |+1， 而 插入 时 最 多 


调整 到 根 ， 即 最 多 比较 次 数 为 | log,i|， 所 以 总 比较 次 数 最 多 为 : 
C,(n)< y | logji| 


< ylog,i-log,l+log,2+log)3+.…+logon 
=log,n!lxnlog,n—1.44n < nlog,n = O(nlog,n) 
可 以 证 明 ， 平 均 比 较 次 数 约 为 2.28n。 可 见 ， 这 种 插入 式 建 堆 历 花费 的 时 间 比 筛选 法 
建 堆 要 多 。 
7.20 解 ; 以 记录 两 个 数据 比较 后 的 较 大 者 为 例 ( 夫 两 者 相等 ， 
任 取 一 个 为 较 大 )， 可 取 较 大 者 为 根 ， 两 个 比较 的 数据 为 其 孩子 。 于 
是 ， 所 有 的 比较 过 程 就 对 应 一 棵 二 又 树 ， 显 然 它 不 一 定 是 完全 二 叉 
树 。 如 右 图 表示 的 比较 过 程 为 : 将 A、B 较 大 的 与 C 比较 ， 取 其 较 
大 者 与 D 比较 。 这 显然 不 是 完全 二 又 树 。 
但 对 锅 标 赛 比较 过 程 ， 则 需 用 完全 二 又 树 描 述 。 
7.21 解 : 由 于 工作 区 可 容纳 4 个 记录 ， 故 采用 4 路 归并 的 选择 树 方法 生成 初始 归并 
段 ， 其 过 程 和 结果 见 下 表 所 示 选择 树 略 )， 共 生成 3 个 初始 归并 段 。 
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(10) (10) 
i 20 (13) (13) 
43 43 [5] [5] [5] 
25 25 (17) (17) 
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输出 结果 
7.22 解 : 2 路 平衡 归并 排序 需要 4 台 人 磁带 机 ， 其 中 ,初始 归并 段 应 在 两 条 带 上 交替 分 
布 ， 归 并 中 生成 的 新 归并 有 段 应 在 为 两 条 市 上 区 准 分 布 。 归 并 过 程 如 下 〈 插 号 表示 当前 归并 
: R1(1L), R3(1L), RS(1L), R7(1L) Tl: R1(4L) 
: R2(1L), R4(1L), R6(1L) T2: R2(3L) 
13: 


: R1(2L), R32L) : R1(7L) 
: R2(2L), RA(L) 


7.23” 解 : 2 路 多 步 归 并 排序 需要 3 台 人 磁带 机 ， 归 并 
过 程 如 右 表 所 示 。 可 见 最 后 还 有 5 个 归并 段 ， 未 能 全 部 
归并 完 ( 需 要 将 它们 重新 分 配 到 其 他 两 条 市 上 再 进行 2 
路 归并 )。 这 是 因为 初始 归并 段 数 分 布 不 好 。 

对 本 题 ,从 2 阶 Fibonacci 数 “0, 1, 1, 2, 3, 5, 8, 13, 2 1 
34，S3$3，… ”看 ， 由 于 2f+fE=2x21+13=S5 最 接近 
15+35=50， 故 理想 的 段 数 分 布 为 Ti=fs+B=21+13=34， 
T2=fs=21。 这 时 需要 补充 $ 个 长 度 为 0 的 衬 段 。 


第 8 草 码 找 表 


8.1 解 : 不 是 ， 平 衡 二 叉 树 才 是 。 

8.2 解 : 不 能 要 求 所 有 结 点 的 平衡 因子 都 是 0， 如 只 有 4 个 结 点 的 二 叉 树 就 做 不 到 。 
可 以 要 求 结 点 的 平衡 因子 尽 可 能 为 0， 理想 情况 就 是 完全 二 叉 树 ， 但 处 理 起 来 比较 困难 。 

8.3 解 : 当 二 又 树 的 叶子 全 部 集中 在 最 后 的 两 层 ( 如 完全 二 又 树 、 二 分 查找 的 判定 树 》 


时 高 度 最 小 ， 当 每 层 只 有 一 个 结 点 〈 如 左 单 枝 、 右 单 枝 二 叉 树 ) 时 高 度 最 大 ， 这 时 平均 查 
找 长 度 最 大 ， 为 (n+1)/2。 
8.4 解 : 深度 为 k 的 AVL 树 结 点 数 最 多 时 为 满 二 叉 树 ， 此 时 结 点 总 数 为 2 一 1。 最 少 结 


点 数 可 以 递 推 得 到 m=n li+tn +1， 其 中 no=0、ni=1， 所 以 ny=2、 n 4、 7。 
一 般 通 式 为 Fuel- (0 - yn)-1， 其 中 中 = LH, = 见 附录 了) 


8.> 解 : 不 能 ， Wp a 
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8.6 略 。 

8.7 解 : 设 原 散 列 表 为 空 ， 则 第 一 个 关键 字 探 得 1 次 、 第 二 个 关键 字 探 租 2 次 、…… 
即 最 少 探查 次 数 为 1+2+3+…+n=n(n+1)/2。 

8.8 解 : 二 分 法 查找 过 程 如 下 : 


序号 : 1 2 3 4 5 6 7 8 9 101112 13 
第 一 次 比较 : [ 3，5,10,12,17,20,23,27,31,34,39,40,41] 
第 二 次 比较 : [ 3，5, 叹 ,12,17,20]23,27,31,34,39,40,41] 
第 三 次 比较 : [ 3，5,10[12,17,20]23,27,31,34,39,40,41] 
第 四 次 比较 : [ 3，5,10[12]17,20,23,27,31,34,39,40,41] 
查找 成 功 ， 经 过 了 4 次 关键 字 比 较 。 

8.9 解 : 


(1) n=10， 高 度 村 log, +l) F4， 这 即 最 大 查找 长 度 。 查 找 成 功 时 ， 
n+l 2-1_ 10+1, 271_ 


ASL = 一 -一 hh 一 
n n 10 10 


近似 计算 :ASL=1log, (n+1)~1=2.46, 差别 大 ( 因 这 时 n 较 小 ), 或 ASL~ 


磊 列 小 。 
(2) n=100， 高 度 十 log, (+l) 上 上 7， 这 即 最 大 查找 长 度 。 查 找 成 功 时 ， 
n+l， 2 -1_100+17 2 -1_ 
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ET log, (n+1) 一 1=2.81， 
n 


ASL = 一 一 hh 一 一 .8 
n n 100 100 
近似 计算 : ASL=1log, (n+1)-1=5.66， 差 别 小 ， a log, (n+1)-~1=5.72， 差 别 更 小 。 
nh 


为 外 ， 对 《1)， 由 于 结 点 数 较 小 ， 也 可 先 画 出 二 分 碍 找 的 
判定 树 ， 见 右 图 所 示 。 奏 找 成 功 时 平均 得 找 长 度 为 : 
ASL=(1x1+2x2+3x4+4x3)/10=2.9 


对 (2)， 因 结 点 数 较 大 ， 画 出 判定 树 后 再 分 析 则 不 合适 。 
8.10 解 : 对 一 个 具体 的 二 又 排 序 树 而 言 ， 其 ASL 为 : 
ASL-= 工 yh = 工 y[h, -D+H= 二 yd +1l 
Dn jl Dn i-1 nN i-1 
其 中 ，hi 为 结 点 的 高 度 ，di 为 结 点 的 路 径 长 度 。 》 "di 称 为 结 点 的 内 路 径 长 度 。 于 是 ， 
1=1 


问题 转化 为 求 毛 有 结 点 二 又 排序 树 的 平均 内 路 径 长 度 , 设 用 Ia) 表示 。 显 然 ID)=0,IC2)=1。 
对 n 个 关键 字 ， 有 nl! 种 排列 ， 对 应 nl! 棵 二 又 排序 树 〈 其 中 有 的 形态 相同 )。 把 这 些 序 
列 分 为 n 种 ;序列 中 分 别 有 0、1、…、n-1 个 关键 字 小 于 第 一 个 关键 字 ( 相 应 有 n-1、n-2、…、 
0 个 关键 字 大 于 第 一 个 关键 字 )。 于 是 对 应 二 又 排序 树 的 左 子 树 中 分 别 有 0、1、…、mn-1 个 
结 点 〈 相 应 地 右 子 树 有 n-1、n-2、…、0 个 结 点 )。 等 概率 时 把 所 有 这 些 情 况 平 均 得 : 


I(n) = L500 +In—1i—1)+n—1| 


1=0 
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=2510)+n -1] (n>, 其 中 10=0, 11=0, 上 一] 人 
D i=0 
该 式 与 习题 7.10 完全 相同 ， 于 是 
I(n)=2(n+1)In(n+1)+O(n) 
所 以 


FC We A Ps EO ~1.39]log,n 
nh n 


8.11 解 : (1) 二 又 排序 树 的 形态 由 输入 序列 决定 ， 一 般 n 个 关键 字 有 nl 种 输入 序列 ， 
所 以 可 有 ml 个 二 叉 排 序 树 ， 但 其 中 有 的 形态 相同 。 对 本 题 ， 关 键 字 有 3 个 ， 故 有 31!=6 种 输 
入 序列 : 1,2,3、1,3,2、2,1.3、2,3,1、3, 1, 2、3, 2, 1]， 相 应 的 二 又 排 序 树 如 下 图 所 示 ， 
其 中 与 序列 2, 1,3、2, 3, 1 对 应 的 二 又 排 序 树 相 同 ， 故 实际 上 只 有 5 种 二 又 排序 树 。 


AG 


(2) 相当 于 求 n 个 结 点 的 二 又 树 的 形态 数 〈 每 种 形态 都 有 目 己 的 中 序 序列 ， 使 其 对 应 


到 1, 2,…, n， 便 得 到 中 序 序列 递增 的 二 又 树 ， 即 二 又 排 序 树 )， 利 用 习题 5.5〈2) 的 结果 
便 知 该 数 为 b = 一 一 .中 = 一 Cs ， 即 1,2,5,14,42,…。 
n+l] nin! n+l 


8.12 解 ; 二 又 排序 树 的 特点 是 中 序 序列 为 递增 有 序 的 ， 本 题 中 序 0 
序列 为 {16, 20, 30, 56, 66, 80}， 将 它们 对 应 到 图 中 ， 结 果 如 右 图 所 示 。 


8.13 解 ; 二 又 排序 树 见 右 图 ， 查 找 成 功 时 平均 查找 长 度 为 49 69 (8 
ASI- ypec =(1+2x2+2x3)/5=2.2 


查找 不 成 功 时 有 右 图 中 虚线 所 示 的 几 种 情况 ， 平 均 查 找 长 度 为 
ASLw= pic; =(2x2+4x3)/6=2.67 


1=1 


注意 这 里 指 关 键 字 比较 ， 不 包 合 空 树 的 空 指针 比较 。 


8.14 解 ， 平均 查找 长 度 ASL= =->h ， 其 中 hi 为 结 点 的 深度 。 
为 使 ASL 最 小 , 就 要 使 结 点 深度 和 最 小 , 这 就 要 使 结 点 尽量 填 满 二 又 树 的 上 层 , 其 结果 是 ， 


最 后 一 层 可 以 不 满 ， 其 上 各 层 为 满 二 又 树 。AVL 平衡 调整 算法 不 一 定 得 到 这 样 的 结果 ， 如 
下 题 的 图 (h》 就 不 是 (输入 顺序 不 同时 )。 

这 里 给 出 两 个 构造 方法 。 其 一 ， 根 据 给 定 的 结 点 数 n， 画 出 一 个 满足 形态 要 求 的 二 广 
树 〈 知 结 点 数 不 能 正好 构成 满 二 又 树 ， 则 符合 条 件 的 二 又 树 有 多 个 )， 然 后 将 其 中 序 序 列 列 
出 ， 再 将 所 给 关键 字 排 序 ， 按 递增 顺序 对 应 到 二 又 树 中 即 可 。 这 就 是 前 面 题 8.12 的 方法 。 

其 二 ， 将 关键 字 排 序 ， 男 出 对 应 的 二 分 得 找 判 定 树 ， 将 各 结 点 质 上 对 应 的 关键 字 即 可 。 
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如 对 关键 字 集合 {7, 29, 10, 9, 43, 67, 12, 861 ，n=8， 按 方法 一 可 以 得 到 8 棵 合乎 要 求 的 
二 又 树 ,， 其 形态 见 下 图 (a) 所 示 , (b) 给 出 了 其 中 的 1 棵 ; 按 方 法 二 只 能 得 到 1 棵 , 见 下 图 (c)。 


(a) 
8.15” 解 : 在 二 又 排序 树 生成 过 程 中 ， 若 遇 到 不 平衡 ， 则 进行 相应 调整 ， 如 下 图 所 示 。 


0 一 一 0 
(4) ~ © RR 型 调整 (5) | 
5) DD 
(a) 插入 4 (b) 插入 5 (c) 插入 7 


LR 型 调整 
0 0 


2 


输入 序列 {4,5,7,2,1,3,6} ‘(3 输入 序列 {4,5,7,2,1,6,3} 
(g) 插入 6 (h) 另 一 棵 AVL 树 
8.16 解 : 插入 后 结 点 可 能 要 分 裂 ， 并 可 能 引起 上 层 结 点 也 要 分 裂 ， 结 果 如 下 图 所 示 。 
,56、， ,56、， ,56、| 
65 | 12 38 12 32 38| 


(a) 初始 (b) 插入 80 (c) 插入 32， 引 起 分 裂 (d) 分 裂 后 


(e) 插入 60， 引 起 分 裂 (f) 分 裂 后 ， 根 要 分 裂 (g) 根 分 裂 后 (h) 插入 46 
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8.17 解 : 匈 下 图 所 示 ， 最 多 7 个 结 点 ， 最 少 4 个 结 点 ， 其 中 “se” 表 示 一 个 关键 字 。 


8.18 解 : 这 里 散 列 表 长 度 m=15， 故 取 散 列 函数 为 K%13。 各 关键 字 的 散 列 地 址 见 下 
图 (a)， 按 二 次 探查 H(K)=(d+i*)%m 构造 的 散 列 表 见 下 图 (b)。 


(a) 
| 有 了 故 与 12 13 14 
(b) 散 列表 a 
成 功 比 较 次 数 1 1 1 1 加 1 1 1 1 4 2 


但 找 成 功 时 的 平均 比较 次 数 为 : 
J 583 
此 题 装填 因子 a=12/15=0.8， 若 用 公式 计算 ， 则 ASL= -一 n(l- Q) =2.012， 差 别 较 大 。 


另外 ， 本 题 若 用 HK)=(dti9)o%om 双向 二 次 探查 ， 结 果 并 无 优势 (上 略 )。 

8.19” 解 : 这 里 没有 给 出 具体 数据 ， 只 能 进行 估计 。 二 次 探查 法 查找 不 成 功 时 的 平均 
查找 长 度 ASLw=1/(1--Q) 三 1.5， 所 以 a 三 1/3， 即 a=n/m=-200/m 三 1/3， 于 是 m 宇 600。 二 次 
探查 要 求 表 长 m 为 满足 4j+3 的 质数 ， 故 m 可 以 取 601。 

由 于 表 长 m 为 质数 ， 除 余 法 的 除数 p 可 直接 取 为 m， 所 以 散 列 函数 H(K)=K%m。 

8.20 解 : 首先 求 出 散 列 地 址 ， 见 下 图 (a)， 据 此 得 到 闭 散 列表 和 开 散 列表 分 别 见 下 图 


(b) 和 (c)。 
HT key next 不 成 功 比 较 次 数 

1 
关键 字 K | 11|78110|1|3|2|4|21 IE 
Earl oil 31 2141 
1 
(a) 1 
0 
0 1 2 3 4 5 6 7 8 9 10 0 
散 列表 2 0 

成 功 比 较 次 数 1 1 2 1 3 2 8 
ee 
0 
Cb) | 站 2 
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对 线性 探 得 法 构造 的 财 散 列 表 ， 得 找 成 功 的 平均 比较 次 数 为 : 
ASL=(1+1+2+1+3+2+8+])/8=2.374 

但 找 不 成 功 的 平均 奏 找 长 度 为 : 

ASLomme (tHHOTSTATSITZHITITIONLI=4.273 

闭 散 列 表 装 填 因 子 a=8/11=0.727， 若 用 公式 计算 ， 则 : 


1 1 1 1 
ASIL~—|1+— |=2.333, ASLiwmsuwcc= 一 | 1 十 
| 1 ) | (一 cy) 


对 拉链 法 构造 的 开 散 列表 ， 查 找 成 功 的 平均 比较 次 数 为 : 
ASL=(1x6+2x2)/8=1.25 

查找 不 成 功 的 平均 查找 长 上 度 为 : 

AS HHOHNOIOLOTJNIO 727 

开 散 列表 装填 因子 a=8/11=0.727， 若 用 公式 计算 ， 则 : 
ASL~1+=-1.364, ASLwwwec=Q =0.727 (相同 ) 


8.21 解 : 即 第 2 章 顺 序 表 采 用 的 定位 〈 按 值得 找 ) 算法 (上 略 )。 
当 采 用 监视 哨 技 术 时 ， 将 监视 哨 设 在 顺序 表 的 末端 ， 即 Rn+l] 处 ， 算 法 如 下 : 


int Search (sqtable *R, keytype K) { 
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和 二 入 下 区 

n=R—>n; 

R->data[n+1] .key=K; // 设 置 监视 哨 

1=1; 

while(R->datal[il] .key!=K) i++; 

1 (Is=nt1ly returmmn 0 // 查 找 成 功 时 返回 & 在 表 中 的 序号 ， 否 则 返回 0 


else return 1; 
} 


该 算法 在 返回 时 也 可 用 “return 1%(n+1);” 来 统一 处 理 查 找 成 功 和 不 成 功 两 种 情况 。 
显然 ， 查 找 成 功 时 找到 第 i 个 元 素 所 需 的 比较 次 数 cF=i; 查找 不 成 功 时 ，while 循环 终 
止 于 了 ->data[n+1].key， 算 法 的 时 间 性 能 与 从 后 同 前 进行 租 找 时 相同 。 
8.22 解 : 即 第 2 章 链表 采用 的 定位 〈 按 值得 找 ) 算法 (上 略 )。 
8.23 解 : 在 递归 中 要 指出 得 找 区 间 的 首 末 位 置 ， 算 法 如 下 : 
Int BiSearch?2 (sqtable *R,int low,int high,keytype K) { 
/ /升序 折 半 查找 ,递归 算法 
int mid; 
if (low>high) return 0; // 奋 不 到 
mid= (low+high) /2; 
1f (K==R->data[mid] .key) return mid; 
if(K<R->data[mid] .key) return BiSearch2 (R,low,mid-1,K); // 在 前 半 部 分 查找 
else return BiSearch2 (R,mid+l,high,K) ; // 在 后 半 部 分 查找 
} 
8.24 解 : 按 “ 右 - 根 - 左 ”的 次 序 进 行 遍历 即 可 。 算 法 略 。 
8.25 解 :可 检查 中 序 序列 是 否 为 递增 有 序 。 遍 历 中 用 pre 保存 结 点 前 趋 的 值 ， 最 后 结 
果 由 全 局 量 flag 表示 。 算 法 如 下 : 


int flag=1; 
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keytype pre=KEY MIN; //KEY MIN 为 关键 字 类 型 的 最 小 值 
Vold detect (bitree 七 ) { 


if (t==NULL || flag==0) return; // 空 树 或 已 为 假 
detect (t—->lchild); 


if (t->data<=pre) {flag=0;return;}// 当 前 <= 前 趋 ， 假 
pre=t—>data; 
detect (t—->rchild); 

} 


如 果 不 想 将 flag 和 pre 设 成 全 局 量 ， 则 可 将 它们 设 成 函数 的 参数 。 但 它们 应 该 是 双 问 
传递 ， 即 按 地 址 传递 〈 或 用 C++ 的 引用 方式 传递 )。 

8.26 解 : 

(1) 插入 过 程 是 从 根 结 点 开始 逐 层 癌 下 寻找 插入 位 置 的 ， 算 法 如 下 : 


bitree insert2 (bitree t,keytype K) {  // 非 递归 算法 
pornker TT Dra 


p=t; 
while(p!=NULL) { 
if (K==p->key) return t; // 树 中 已 有 结 点 *s， 无 须 插入 
f=p; / /保存 当 前 结 点 ， 它 是 下 一 个 结 点 的 双亲 
if (K<p->key) p=p->lchild;  // 在 左 子 树 上 找 插入 位 置 
else p=p->rchild; // 在 右 子 树 上 找 插 入 位 置 
} 
s=new node; // 生 成 新 结 点 


s—->lchild=NULL; 
s—>rchild=NULL; 


SsS—>key=K; 

if (t==NULL) return s; // 原 树 为 室 ， 新 结 点 *s 作为 根 指针 
if (K<f->key) f->lchild=s; // 将 *s 插入 为 *f 的 左 孩 子 

else f->rchild=s; // 将 *s 插入 为 xf 的 右 孩 子 


return tt; 
} 


(2) 查找 中 每 次 与 根 比较 ， 由 此 决定 下 一 步 是 向 左 子 树 还 是 右 子 树 进行 查找 ， 算 法 
如 下 : 


pointer Search2 (Bitree t,keytype K) { // 非 递归 算法 
pointer p; 


p=t; 
while(p!=NULL) { 
if (K==p->key) return p; / /但 找 成 功 
if (K<p->key) p=p->lchild;  // 在 左 子 树 中 查找 
else p=p->rchild; // 在 右 子 树 中 奋 找 
} 
return NULL; / /但 找 失 败 


} 


8.27 解 : 依次 对 每 一 个 散 列 地 址 1 一 26， 线 性 探查 输出 其 同义词 即 可 。 由 于 装填 因子 
小 于 1， 上 肯定 有 空 单元 ， 故 探查 中 不 必 检 查 是 否 探查 了 m 次 。 算 法 如 下 : 


void disp(hashtable HT) { 
ZE 
for(i=l1;i<=26;1i++) { 
J]=1; 
while (HT[J] .key!=OPEN) { 
if (HT[jJ] .key==1) cout<<HT[]] .key; 
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J]=(J+1) Sm; 
} 
} 
} 


8.28 解 : 统计 每 个 散 列 地 址 下 不 成 功 比 较 次 数 ， 再 除 以 表 长 即 可 。 算 法 如 下 : 


float unsecc(chainhash HT) { 
pointer p; 
float sum; 
sum=0;} 
for(1i=0;1i<m;1i++) { 
p=HT [1]; 
while(p!=NULL) {sum++;p=p—->next;)} 
} 


return sum/m; 


第 9 章 文件 


答案 略 。 


1. 引用 

C++ 不 仅 对 C 的 已 有 内 容 作 了 很 多 改进 和 增强 ， 而 且 还 增加 了 一 些 新 的 功能 ， 引 用 就 
是 其 中 之 一 。 何 单 地 说 ， 引 用 就 是 男 一 变量 (或 常量 ) 的 别名 ， 对 它 的 使 用 就 是 对 原 变 量 
(或 常量 ) 的 使 用 。 语 法 符号 为 &( 不 是 取 地 址 )。 如 

void main() { 


int a=5,pb=3,c,&d=c;//d 为 c 的 引用 (或 者 说 d 为 c 的 别名 ) 


d=a+b; / /修改 d 就 是 修改 c (结果 c 为 8) 
cout<<c<<endl; 

} 

2. 引用 传递 


在 函数 调用 时 ， 主 调 函 数 和 被 调用 函数 间 信 息 的 传递 一 般 有 三 种 方式 : 全 局 量 、 子 数 
参数 和 函数 返回 伍 。 对 参数 传递 方式 ， 一 般 又 有 两 种 : 传 值 方式 和 传 指针 方式 。 后 者 本 质 
上 也 是 传 值 〈 传 指针 的 值 )。 传 值 方式 是 单 问 的 : 被 调用 困 数 修改 形 参 时 ， 实 参 并 不 改变 。 
调用 执行 时 先 将 实 参 内 容 找 贝 到 形 参 ， 夺 实 参 所 占 罕 间 较 大 (如 结构 体 )， 则 比较 费时 。 传 
指针 方式 是 双向 的 : 被 调用 函数 修改 形 参 指针 所 指向 的 量 后 ， 实 参 指 针 所 指向 的 量 同时 修 
改 〈 但 实 参 指针 本 喘 的 值 并 不 变 )。 

右 采 用 引用 参数 ， 则 由 于 形 参 和 实 参 实 质 上 是 同一 个 量 ， 参 数 传 递 时 束 避 免 了 传 值 方 
式 〈 单 向 传递 ) 时 实 参 到 形 参 的 数据 拷贝 《从 而 节省 时 间 )， 又 比 传 指针 方式 ( 双 辣 传递 ) 
人 简洁 目 然 (有关 量 通 过 参数 名 直接 访问 ,而 不 是 通过 指针 间接 访问 )。 以 2 个 数 的 交换 和 求 
和 为 例 ， 这 些 传递 方式 的 对 比如 表 B.1 所 示 。 

表 B.1 参数 传递 方式 对 比 


C 语句 C++ 语 句 
int sum(int x,int y) {// 传 值 int sum(int gx,int &y) {// 传 引用 
return x+y; //X,y 为 实 参 a,b 的 拷贝 | return x+ty; //x,y 就 是 实 参 a,b 本 身 
} } 
void swap (int *x,int *y) {// 传 指针 void swap (int &x,int &y) {// 传 引用 
5 1 立 :; 
Z=*x;*x=*y;*y=Z; ”/ /通过 指针 间接 访问 Z=X; X=y; y=2Z; // 通 过 名 字 直 接 访 问 
} / /X,Y 为 实 参 a,b 的 地 址 } //x,y 就 是 实 参 a,b 本 身 
Vold maln() { Vold maln() { 
int a=5,b=3,c; int a=5,b=3,c; 
c=sum (a,b); // 传 a,b 的 值 c=sum (a,b); // 传 a,b 的 引用 


swap (&a, &b); // 传 ab 的 地 址 swap (a,b); // 传 a,b 的 引用 


} } 
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特别 地 ， 对 传 指针 方式 ， 若 指针 本 身 的 值 ( 不 是 指针 所 指 对 象 ) 需要 返回 ， 则 参数 应 
为 该 指针 的 指针 (二 级 指针 )， 使 用 更 不 方便 。 对 此 一 个 解决 方法 是 采用 函数 值 返 回 修改 后 
的 指针 。 但 采用 引用 传递 更 简便 。 以 8.3.1 节 二 又 排 序 树 的 删除 为 例 ， 并 假设 待 删 点 P 有 双 
亲 ， 日 为 双亲 下 的 左 孩 子 仁 >lchild， 三 种 方法 对 比如 下 。 

(1) 用 函数 值 返 回 修 改 后 的 指针 。 


pointer del node (pointer p) { //p 指 癌 待 删 点 
pointer db; 
if (p==NULL) return; // 空 结 点 ， 不 存在 
if (p->rchild==NULL) { //P 只 有 左 子 树 
q=p; p=p->lchild; delete q; 
} 
else if(p->lchild==NULL) {*…}//P 只 有 右 子 树 


else ({…} //P 有 2 个 子 树 
return p; // 返 回 删除 后 的 子 树 ( 根 ) 


} 


该 函数 的 调用 形式 为 仁 >lchild=del node( 全 >lchild)。 
(2) 用 参数 返回 修改 后 的 指针 。 这 时 参数 为 指针 的 地 址 〈 即 指针 的 指针 ， 二 级 指针 )。 


void del node (pointer *R) { //R 为 指 回 等 删 点 的 指针 的 指针 
pointer db; 
if((*R)==NULL) return; // 空 结 点 ， 不 存在 
if( (*R)—>rchild==NULL) { // (*R) 只 有 左 子 树 
q= (*R) ; (*R)= (*R)—>lchild; delete aq; 
} 
else if((*R)->lchild==NULL) {*…}// (XR) 只 有 右 子 树 
else {…} // (*R) 有 2 个 子 树 
} 


该 函数 的 调用 形式 为 del node(&( 人 >lchild))。 

(3) 用 引用 返回 修改 后 的 指针 

Vold del node (Polnter &p) { //P 为 指 回 符 删 点 的 指针 的 引用 

pointer q,b; 

if (p==NULL) return; // 空 结 点 ， 不 存在 

if (p->rchild==NULL) { //P 只 有 左 子 树 
q=p; p=p->lchild; delete gq; 

} 

else if(p->lchild==NULL) {*…}//P 只 有 右 子 树 

else {…} //P 有 2 个 子 树 

} 

该 函数 的 调用 形式 为 del node( 人 >lchild)。 

一 般 地 ， 传 值 方式 都 可 被 传 引用 方式 所 取代 ， 但 实 参 所 占 空 间 不 大 且 只 需 单 问 传 递 时 
习惯 上 还 是 采用 传 值 方式 ， 如 基本 类 型 char、int、float、double 等 。 另 外 ， 即 使 采用 引用 
传递 方式 ， 也 可 实现 “ 单 回 传递 ”， 即 在 参数 表 中 的 该 参数 前 加 const 修饰 ， 以 限制 被 调用 
国 数 对 该 参数 的 修改 ， 如 把 前 述 求 和 函数 写成 int sum(const int &x, const int &y) 等 。 


1. 绝对 时 间 

在 排序 算法 运行 前 后 , 分 别 用 C/C++ 的 系统 函数 clock( ) 获 得 当前 系统 时 间 ， 则 前 后 两 
次 的 时 间 差 就 是 绝对 时 间 。 但 这 里 的 时 间 单 位 是 系统 内 部 的 TCK 数 , 把 它 除 以 系统 每 秒 钟 
的 TCK 数 便 得 到 以 秒 为 单位 的 时 间 。 参 考 用 法 如 下 : 


void main() { 
CLOCK TC 区 


tl1l=clock (); 
BubbleSort (R,n); 
t2=clock (); 


cout<<" 时 间 : "<<float (t2-t1)/CLK TCK<<endl; 
} 


2. 逻辑 时 间 

设置 计数 器 C、M， 分 别 统计 关键 字 的 比较 和 移动 次 数 。 为 便于 多 处 使 用 ， 把 计数 器 
设置 为 全 局 量 。 但 计数 器 不 宜 采 用 系统 提供 的 标准 整 型 量 ， 因 为 规模 较 大 时 ， 关 键 字 比较 
和 移动 次 数 很 大 ， 这 些 量 会 洲 出 。 这 里 采用 内 部 类 型 ”int64。 以 直接 插入 排序 为 例 ， 参 考 
用 法 如 下 : 


int64 C,M; // 比 较 和 移动 次 数 
void InsertSortl (list R,int n) {// 直 接 插入 排序 ， 带 监视 哨 
TH 
For(ti=221< 17144) 1 // 依 次 插入 R[2],R[3],*…,R[n] 
if (C++, R[i] .key>=R[i-1] .key) continue;V//R[Ii] 位 置 已 正确 ， 本 趟 不 需 插 入 
M++, R[0]=R[i]; //R[0] 是 监视 哨 
]=1—1; 
do { // 查 找 RI[i] 的 插入 位 置 
M++, R[j+1] =R[j];j--; // 记 录 后 移 ， 继 续 问 前 搜索 
} while (C++,R[0] .key<R[I]] .key); 
M++, R[j+1]=R[0]; // 插 入 RI[i] 


} 
} 
其 中 用 逗号 运算 符 把 计数 器 插入 到 有 关 语 句 处 。 注 意 ， 在 统计 绝对 时 间 时 ， 以 上 计数 
锅 语 句 要 去 掉 。 
3. 随机 数 的 生成 
为 了 测试 排序 算法 的 平均 性 能 ， 可 对 均匀 分 布 的 随机 数 序列 进行 排序 。 随 机 数 的 生成 
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要 用 到 随机 函数 。 但 这 里 不 宜 采用 系统 提供 的 随机 函数 rand( )， 因 为 它 生成 的 随机 数 范围 
为 0 一 RAND MAX=32 767， 当 规模 大 于 RAND MAX 时 ， 输 入 的 数据 序列 中 必 出 现 大 量 
的 重复 数据 ， 即 序列 的 “随机 性 ”不 好 。 一 种 简单 做 法 是 取 两 次 随机 函数 之 积 作 为 随机 数 。 
下 面 给 出 一 个 常用 的 随机 数 生 成 算法 一 一 素数 模 乘 同 余 法 。 


int random2() {return rand()*rand();} // 最 大 值 约 为 下 面 M 的 一 半 


int random3 () { // 素 数 模 乘 同 余 法 ,0~M 
int A=16807; // 或 48271 
int M=2147483647; // 有 符号 4 字 节 最 大 素数 
int Q=M/A; 
int R=MS%SA; 
atat1e Tit = // 种 子 ( 设 为 1) 
1 Rl 


xl1=A* (XSO) —R* (X/O) ; 
0 Y=X1 
else X=XxX1]+M; 
return x; 


} 


为 了 得 到 不 同 的 随机 数 序列 ， 可 改变 随机 数 发 生 需 的 种 和子 。 对 系统 函数 rand( ) 要 用 为 
一 函数 srand( ) 来 设置 种 子 。 但 要 注意 , 右 种 子 取 为 系统 时 间 , 虽然 可 获得 不 同 的 输入 序列 ， 
但 因 每 次 运行 时 系统 时 间 不 同 ， 于 是 即使 同一 排序 算法 ， 每 次 运行 的 结果 一 般 就 不 同 ， 即 
结 东 难以 重复 ， 不 便 在 不 同 的 时 间 、 不 同 的 计算 机 上 进行 比较 〈 或 者 说 在 比较 时 数据 会 有 
一 定 的 出 入 )。 

由 于 对 不 同 随 机 数 序 列 的 排序 时 间 有 差别 ， 还 可 以 对 多 个 序列 的 运行 结果 进行 平均 以 
更 好 地 反映 算法 的 平均 情况 。 但 一 般 说 来 ， 规 模 越 大 ， 且 输入 序列 的 随机 性 越 好 ， 则 单 次 
运行 的 结 末 束 越 接近 平均 结果 。 


1， 单 链表 综合 实验 
尽 可 能 多 地 实现 单 链表 的 有 关 运 算 , 并 综合 在 一 起 : 单 链 表 的 建立 ( 头 插 法 、 尾 插 法 )、 


特定 结 点 数 统计 (长 度 、 正 / 负 值 结 点 数 等 ); 查找 ( 按 值 、 按 序号 ); 删除 ( 按 值 、 按 序号 ); 
变换 ( 逆 置 、 正 / 负 值 结 点 分 置 前 后 两 端 等 )， 性 质 判断 (如 是 否 构成 等 差 、 等 比 、 全 为 正 
数 等 )。 


2. 二 又 链 表 综 合 实 验 

尽 可 能 多 地 实现 二 又 链表 的 有 关 运 算 ， 并 综合 在 一 起 : 二 又 链 表 的 建立 (根据 补充 虚 
结 点 的 层次 序列 、 补 充 虚 结 点 的 先 序 序列 、 先 序 加 中 序 序列 、 后 序 加 中 序 序列 等 ); 特定 结 
点 数 统计 〔 结 点 总 数 、 叶 结 点 数 、 度 1 结 点 数 、 度 2 结 点 数 、 正 / 负 值 结 点 数 等 )， 求 高 度 ; 
求 宽度 ; 遍历 (递归 和 非 递 归 的 先 根 、 中 根 、 后 跟 遍 历 ;， 层次 遍历 等 ); 性 质 判 断 (如 是 否 
为 完全 二 义 树 、 大 /小 根 扒 、 全 为 正 数 等 ); 特定 关系 结 点 输出 〈 如 兄弟 、 双 杀 、 祖 先 等 )。 

3. 有 向 图 综合 实验 

尽 可 能 多 地 实现 有 问 几 的 有 关 运 算 ， 并 综合 在 一 起 : 图 的 建立 (根据 输入 的 边 信 息 建 
立 邻接 矩阵 或 邻接 表 );， 输出 指定 顶点 信息 〈 出 、 入 度 ， 顶 点 值 ， 邻 接点 等 ); 遍历 〈 递 归 
和 非 递 归 的 DFS 人 遍历 、BFS 壳 历 ); 删除 、 插 入 顶点 ; 删除、 插入 边 ; 简单 路 径 问 题 〈 指 
定 两 点 间 是 否 有 简单 路 径 、 是 否 有 包含 所 有 顶点 的 简单 路 径 ); 简单 回路 问题 (是否 有 从 指 
定点 出 发 的 简单 回路 、 是 否 有 包含 所 有 顶点 的 简单 回路 ); 求 特定 距离 顶点 ( 踊 指 定点 指定 
最 短路 径 长 度 的 顶点 、 距 指定 点 最 短路 径 长 度 最 大 的 顶点 等 )。 

4. 排序 算法 综合 实验 

实现 基于 比较 的 各 种 基本 排序 方法 , 并 尽 可 能 给 出 改进 ; 对 不 同 规模 、 不 同 数据 集 ( 随 
机 序列 、 递 增 序 列 、 递 减 序 列 ) 进行 排序 ， 测 试 算 法 的 绝对 时 间 和 好 辑 时 间 《 比 较 次 数 、 
移动 次 数 )， 将 结果 汇总 成 表 ， 并 与 理论 结果 比较 。 

5. 散 列表 综合 实验 

实现 开 敌 列表 、 闭 敌 列 表 的 建立 和 查找 ， 改 变 敌 列 录 数 、 冲 突 处 理 方 法 、 装 填 因 子 等 ， 
统计 查找 成 功 和 不 成 功 时 的 平均 查找 长 度 ， 将 结果 汇总 成 表 ， 并 与 理论 结果 比较 。 

以 上 几 个 实验 是 基础 性 的 ， 目 的 是 通过 上 机 来 体验 和 向 握 课 本 的 有 关 基 本 知识 ， 比 如 
二 叉 链 表 的 实验 可 考查 递归 技术 的 灵活 应 用 ， 对 非 递归 遍历 和 层次 遍历 ， 可 考查 栈 和 队列 
的 使 用 等 。 可 根据 实验 学 时 的 多 少 选 做 ;根据 完成 情况 ， 还 可 把 内 容 具 体 化 ， 如 设 单 链 表 
的 结 点 表示 学 生 信 息 ， 则 把 问题 转化 为 对 学 生 信 息 进行 管理 ， 又 如 设 二 又 链表 的 结 点 表示 
家 族 成 员 信息 ， 则 把 问题 转化 为 对 族谱 进行 管理 等 。 

根据 学 生 情 况 ， 也 可 安排 一 些 较 单 一 、 偏 应 用 的 实验 ， 如 哈 夫 曼 编码 〈 最 优 二 又 树 的 
应 用 )、 中 组 表达 式 的 转换 与 求 值 〈 栈 的 应 用 ) 等 。 


1. 级 数 和 


(1) py 

i=1 
C7) Sit2 + tn = + n+ 

i 6 

i 本 ntl _ 
(3) 》2 =1+2 +2 +-…+2 =2” -1， 更 一 般 》a =1+a+a +-…+a” = 
i=0 二 


k 
(AY Si SL F223 FE SE D2 41 
1=1 
证 : 记 S=1.2"+2.21+3.22+.…+k.2x1， 两 边 乘 以 2， 再 相 减 
2 三 2 2 pe 2 
2.S-S=S=k.2 -4(.20+1.2+1.22+…+1.2) 
DI | 


k 
(57 SE 2 S02 F122 Ft Ds 2 492 
1=] 
2. 调和 级 数 
站 
2 3 n 


近似 计算 : 因为 H, = > -As (Ax =1) 
n+1/2 ] 


所 以 了 HH,， ~|， 一 dx -al n+ 二 -mo)+07 


准确 计算 : 也 ml 1 
n 


其 中 y=0.577215665… 为 欧 拉 常数 ，0 <& < = - 
了 


范围 估计 : ln(n)<H,<1+ln(n) 
3. 斯 特 林 (Stirling) 阶乘 公式 


io 
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取 2 为 撒 的 对 数 : 
[+3 iogsn ~ (logsO)nt~log, (27) + bogse | 二 
2 2 12n ry" 


粗略 估计 : log,n!xnlog,n 一 1.44n (log,es1.4426951 ) 或 log,nlxnlog,n 一 1.5n 
近似 计算 : 因为 In(n0)=ln(n)+In(n 一 D+…+In(1)=》In()Ax (Ax=]) 
1=1 


n+1/2 | 
In(x)dx =(xInx—x)| = (nt)jn(nt3 ntoIn2 
2 


n+1/2 


nn 


准确 计算 : In(n!) -人 n+]ma -nt TinQm) + +o[ 记 | ( 即 斯 特 林 公式 取 目 然 对 数 ) 
4. 斐 波 那 契 数列 (Fibonacci Sequence) 的 通 项 

RE-=0E=LEF=F ,+F，>2) 

取 龙 波 那 契 数 为 系数 构造 多 项 式 〈 生 成 函数 ): 

F(x)=F +Fx+Ex’ +-……+F xX" + 

两 边 分 别 乘 x、x， 再 相 减 ; 

XF(X) = 了 X 二 BEX- +-…+F, ,x + 

xX F(X)=Fx +-…+F, ,X" + 


(1—x—x )F(x)=F +(FE —F)x=x 


所 以 FGx) = 
] 一 X 一 人 X 
把 它 拆 开 : 
x x i Iss 和 
We eh 


将 1M1- 生 ) 和 1/(1- yx) 泰勒 展开 并 整理 得 : 
] 
本 司 
与 原生 成 函数 对 比 系数 ， 得 : 


EU 二 (I+qx+ x +-…—l— yx—y x —…) 


| 
F = 一 n ,un 
" (Hg —v) 
由 于 |wl|s0.618034<1， 故 n 较 大 时 : 


BE sx- 天 四 


V5 
5. 卡特 兰 (Catalan) 数列 的 通 项 
b =1 b, -ybb ， (n>1) 
构造 生成 函数 : 
F(x) =b, +b,x+b,x” +-…+b, x" + 


将 其 平方 得 : 
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F2(x) =b? +2b,b,x + (2bob, +bz)Jx2z+(2bb +2bb,)xs+(2bb +2bb + b?)x +--. 
=by +(bob, +b,bo)x+(bob, +bb +b,b,)x +(bobs +bjb, +b,b, +b;sbo)x +-… 
=b, +b,x+b,x” +bysx + 
=[F(x)—1]/x (bo =1) 

所 以 xF*(x)—F(x)+1=0 

但 x=0 时 该 式 退 化 为 线性 ， 二 次 求 根 公式 不 通用 。 把 它 改写 : 

[xF(2)] —[xF(x)]+x=0 

则 

xF(x) = 


1+ Vl- 4x 
2 

由 于 x=0 时 xF(x)=0， 所 以 : 
0 a 站 
将 该 式 泰 勒 展开 ， 与 原 xF(x) 对 比 ， 第 n+l 项 的 系数 即 为 bs。 
先 对 (1 一 4x)? 泰勒 展开 ， 其 第 n+1 项 为 : 

oo Da 2) (on) gy [=- 1 | 

(n+1)! 

(n+1)! 

2n)! jxn 

(n+1)!ln! 


所 以 xF() = -70-4x) 展开 式 的 第 n+l 项 系数 ， 即 
_ | (2n)! ?| 1 (2n)! 1 Ca 


2 +Dn | n+l nin! n+l ™” 
6. 快速 排序 平均 比较 次 数 、 二 又 排 序 树 平均 内 路 径 长 度 通 项 
Cn) = 二 Cd +n 一 ] (n>1)， 其 中 Co=0, C1=0, C2=1, 
nN k=0 


两 边 乘 以 ni: 
nC(n)= 75 CQO)+n -nn (nz¥]) 


J 
@-_ Dcm-D)=25 C0)+m-1 -nm-)) (n > 2) 
两 式 相 减 : 


nCn)-m-lCan-D=2Can-D+2n-2， 即 
nC(n)=(n+l)C(n—D)+2n -2 (>2) 
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易 见 n=1 也 成 立 。 上 式 两 边 除 以 n(n+1),， 注意 一 =- ， 逐 级 递 推 


n(n+l) n n+l 
i ! | 


n+l n n+l n n+l 


a 
卫 


n n 一 ] 


nn 一 ] n 


CO _ C(O0) +23-2(2- 

2 ] 2 ] 2 

全 部 相 加 : 

| 
2 n 


n+l] ] 


=C(0)+2(H,, -D- 2 


= 一 Hi EE 
n+l] 


所 以 CO =2+lH -4n+lD+2 
sx2n+1l)inmn+l)+(2Y 一 4)n+1)+2 
~ 2nln(n) + Cr _ 4)n 
其 中 也 =1+ t+ et | 调和 级 数 ， H x In(n)+y〈 见 前 述 结果 )。 
注意 ,快速 排序 有 不 同 的 划 分 算法 ， 其 中 比较 次 数 可 能 多 于 mr-1l 次 ， 如 mn 次 、n+l 次 ， 


GN)= cg +on+B 


这 时 Co。、C1、C; 等 也 会 不 同 ， 类 似 推导 可 知 ， 虽然 最 终 表达 式 会 略 有 不 同 ,但 复杂 
的 数量 级 相同 ， 都 为 O(log, n )。 
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